Add Transcribe docs (about/guide/tech) + refresh Redact docs
- New: transcribe-about.php, transcribe-guide.php, transcribe-tech.php with full en/no/uk/pl translations (3-engine cascade, diarization, vocab) - New: translations/transcribe-about|guide|tech.php (4-lang strings) - New: scripts/translate-pages.php (Azure gpt-4o CLI translation helper) - Add korr-doc-links nav to transcribe.php - Refresh redact-about|guide|tech.php — point to assets/images/redact/ - Fix all "never written to disk" wording in redact translations - Add Min Sak/corpus save workflow to redact guide and tech privacy section - redact.php upload hint: correct in-memory wording Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -0,0 +1,467 @@
|
||||
<?php
|
||||
return array (
|
||||
'en' =>
|
||||
array (
|
||||
'nav_about' => 'About',
|
||||
'nav_guide' => 'User guide',
|
||||
'nav_howit' => 'How it works',
|
||||
'nav_opentool' => '← Open the tool',
|
||||
'nav_signin' => 'Sign in',
|
||||
'nav_open' => 'Open Transcribe →',
|
||||
'hero_kicker' => 'Technical Reference · Transcribe',
|
||||
'hero_title' => 'How Transcribe works under the hood.',
|
||||
'hero_sub' => 'Three-engine cascade, GPU-accelerated Whisper, pyannote.audio diarization, and optional GPT-4o cleanup — all in a single pipeline.',
|
||||
'stat_engines' => 'engines in cascade',
|
||||
'stat_latency' => 'avg. latency (large-v3)',
|
||||
'stat_wer' => 'WER on Norwegian (Azure)',
|
||||
'stat_speakers' => 'max diarization speakers',
|
||||
'toc_title' => 'Contents',
|
||||
'toc_1' => 'Architecture overview',
|
||||
'toc_2' => 'Engine 1: Azure Batch Speech',
|
||||
'toc_3' => 'Engine 2: Google Cloud Speech-to-Text v2',
|
||||
'toc_4' => 'Engine 3: Whisper GPU (large-v3)',
|
||||
'toc_5' => 'Speaker diarization',
|
||||
'toc_6' => 'Vocabulary injection',
|
||||
'toc_7' => 'Post-processing: AI cleanup',
|
||||
'toc_8' => 'Language support',
|
||||
'toc_9' => 'Privacy and data handling',
|
||||
'arch_title' => 'Architecture overview',
|
||||
'arch_intro' => 'Transcribe uses a three-engine cascade. Each engine is attempted in priority order; if the primary engine is unavailable or returns an error, the pipeline automatically falls through to the next. This means a transcript is produced even during cloud service outages.',
|
||||
'arch_cascade_label' => 'Engine cascade',
|
||||
'arch_e1' => 'Azure Batch Speech',
|
||||
'arch_e1_sub' => 'Priority · Cloud · Optimised for Norwegian',
|
||||
'arch_e2' => 'Google Cloud Speech-to-Text v2',
|
||||
'arch_e2_sub' => 'Fallback · Cloud · Broad language support',
|
||||
'arch_e3' => 'Whisper large-v3 (GPU)',
|
||||
'arch_e3_sub' => 'Final fallback · On-premise GPU · Always available',
|
||||
'arch_post1' => 'Speaker diarization (pyannote.audio)',
|
||||
'arch_post1_sub' => 'Optional · Runs on GPU server post-transcription',
|
||||
'arch_post2' => 'AI cleanup (GPT-4o mini / GPT-4o)',
|
||||
'arch_post2_sub' => 'Optional · Azure OpenAI · Error correction + terminology',
|
||||
'e1_title' => 'Engine 1: Azure Batch Speech',
|
||||
'e1_intro' => 'Azure Cognitive Services Speech-to-Text (Batch Transcription API) is the primary engine. It is the highest-accuracy option for Norwegian and is used for all production transcriptions when available.',
|
||||
'e1_model' => 'Model: <code>nb-NO</code> locale with custom acoustic model. Falls back to locale-matched model for other languages.',
|
||||
'e1_latency' => 'Latency: typically 0.5–2× real-time for audio up to 200 MB.',
|
||||
'e1_format' => 'Accepted formats: all formats accepted by Azure (MP3, WAV, OGG, M4A, FLAC, WEBM — converted server-side if needed).',
|
||||
'e1_auth' => 'Authentication: managed identity + subscription key stored in server environment variables.',
|
||||
'e2_title' => 'Engine 2: Google Cloud Speech-to-Text v2',
|
||||
'e2_intro' => 'Google Cloud Speech-to-Text v2 (Chirp model) is the second engine in the cascade. It activates automatically if Azure returns an error or is unreachable.',
|
||||
'e2_model' => 'Model: <code>chirp</code> — Google\'s latest large ASR model, strong multilingual support including Norwegian, Polish, and Ukrainian.',
|
||||
'e2_latency' => 'Latency: comparable to Azure for most file sizes.',
|
||||
'e2_format' => 'Format handling: audio is re-encoded to FLAC before submission if needed.',
|
||||
'e3_title' => 'Engine 3: Whisper GPU (large-v3)',
|
||||
'e3_intro' => 'OpenAI Whisper large-v3 runs on a dedicated GPU server (ocelot — SimplePod RTX 3060 12 GB at 194.93.49.14:20004). It is always available as the final fallback and never has service outages.',
|
||||
'e3_model' => 'Default model: <code>large-v3</code>. Switchable to large-v2, medium, small, base, or tiny in Advanced options.',
|
||||
'e3_vocab' => 'Vocabulary injection: the <code>initial_prompt</code> parameter is used to prime Whisper with domain-specific terms before transcription begins. This is a Whisper-native mechanism — the prompt is not included in the output.',
|
||||
'e3_vad' => 'VAD filter: when enabled, the <code>vad_filter=True</code> parameter uses Silero VAD to remove silence and non-speech before processing.',
|
||||
'e3_latency' => 'Latency: approximately 2–4× real-time on RTX 3060. large-v3 on a one-hour recording takes roughly 15–30 minutes.',
|
||||
'e3_note' => 'Whisper operates offline — audio never leaves the ocelot GPU server when this engine is used. No cloud API calls are made.',
|
||||
'diar_title' => 'Speaker diarization',
|
||||
'diar_intro' => 'Speaker diarization assigns each segment of the transcript to a speaker. Transcribe uses <strong>pyannote.audio</strong>, an open-source Python library, running as a service on the same GPU server as Whisper.',
|
||||
'diar_pipeline' => 'Pipeline: <code>pyannote/speaker-diarization-3.1</code>',
|
||||
'diar_flow' => 'How it works:',
|
||||
'diar_f1' => 'The audio is first transcribed by whichever engine is selected.',
|
||||
'diar_f2' => 'pyannote.audio processes the audio independently to detect speaker turn boundaries.',
|
||||
'diar_f3' => 'Whisper\'s word-level timestamps (where available) or segment timestamps are aligned with the diarization output.',
|
||||
'diar_f4' => 'Each line is then relabelled with the speaker identity: SPEAKER 1, SPEAKER 2, etc.',
|
||||
'diar_count' => 'Speaker count: if you provide a number, it is passed as <code>num_speakers</code> to the diarization pipeline. If left blank, pyannote uses its default clustering algorithm to estimate the number of speakers.',
|
||||
'diar_limit' => 'Maximum: 20 speakers. Performance degrades above 6–8 speakers in a single recording.',
|
||||
'vocab_title' => 'Vocabulary injection',
|
||||
'vocab_intro' => 'The vocabulary preset mechanism works by prepending domain-specific terms to Whisper\'s <code>initial_prompt</code> parameter. This steers the model\'s token probabilities towards the supplied vocabulary before it processes the audio.',
|
||||
'vocab_limit' => 'Limit: the combined preset + custom prompt must be ≤ 500 characters. Longer prompts are silently truncated.',
|
||||
'vocab_builtin' => 'Built-in presets are stored server-side as strings and concatenated with any custom text entered by the user. The final prompt is passed directly to Whisper — it is not sent to an LLM and is not included in the transcript output.',
|
||||
'vocab_note' => 'Vocabulary injection only affects the Whisper engine. Azure Speech and Google Cloud use their own language model and are not influenced by this parameter.',
|
||||
'cleanup_title' => 'Post-processing: AI cleanup',
|
||||
'cleanup_intro' => 'The optional AI cleanup pass sends the raw transcript to Azure OpenAI for correction. It does not re-transcribe the audio — it corrects the text output.',
|
||||
'cleanup_prompt' => 'System prompt instructs the model to: fix ASR recognition errors (homophones, misheard words), normalise punctuation and capitalisation, correct Norwegian legal terminology, preserve speaker labels and timestamps exactly, and return the corrected transcript in the same format.',
|
||||
'cleanup_mini' => 'GPT-4o mini: <code>gpt-4o-mini</code> deployment on Azure. Fast, low cost. Best for clean recordings with minor errors.',
|
||||
'cleanup_full' => 'GPT-4o: <code>gpt-4o</code> deployment on Azure. Slower, higher cost. Best for noisy recordings or complex domain vocabulary.',
|
||||
'cleanup_privacy' => 'The transcript text is sent to Azure OpenAI for this step. If you choose not to run cleanup, the transcript never leaves the server environment.',
|
||||
'lang_title' => 'Language support',
|
||||
'lang_intro' => 'The following languages are explicitly supported. Other languages may work via Whisper\'s multilingual model but are not tested or optimised.',
|
||||
'lang_table_lang' => 'Language',
|
||||
'lang_table_engine' => 'Primary engine',
|
||||
'lang_table_notes' => 'Notes',
|
||||
'lang_nb' => 'Norwegian Bokmål',
|
||||
'lang_nb_engine' => 'Azure Speech (nb-NO)',
|
||||
'lang_nb_notes' => 'Best accuracy. Dedicated Norwegian acoustic model.',
|
||||
'lang_nn' => 'Norwegian Nynorsk',
|
||||
'lang_nn_engine' => 'Azure Speech (nn-NO)',
|
||||
'lang_nn_notes' => 'Azure has a dedicated nn-NO model. Whisper fallback also strong.',
|
||||
'lang_en' => 'English',
|
||||
'lang_en_engine' => 'Azure Speech (en-*)',
|
||||
'lang_en_notes' => 'Excellent accuracy. Multiple regional locales available.',
|
||||
'lang_pl' => 'Polish',
|
||||
'lang_pl_engine' => 'Azure Speech (pl-PL)',
|
||||
'lang_pl_notes' => 'Good accuracy. Whisper also strong for Polish.',
|
||||
'lang_uk' => 'Ukrainian',
|
||||
'lang_uk_engine' => 'Google Cloud (uk-UA)',
|
||||
'lang_uk_notes' => 'Azure limited support; Google Cloud Chirp and Whisper both strong.',
|
||||
'lang_sv' => 'Swedish',
|
||||
'lang_sv_engine' => 'Azure Speech (sv-SE)',
|
||||
'lang_sv_notes' => 'Good accuracy. Closely related to Norwegian — easy to confuse on auto-detect.',
|
||||
'lang_da' => 'Danish',
|
||||
'lang_da_engine' => 'Azure Speech (da-DK)',
|
||||
'lang_da_notes' => 'Good accuracy.',
|
||||
'lang_de' => 'German',
|
||||
'lang_de_engine' => 'Azure Speech (de-DE)',
|
||||
'lang_de_notes' => 'Excellent accuracy.',
|
||||
'lang_fr' => 'French',
|
||||
'lang_fr_engine' => 'Azure Speech (fr-FR)',
|
||||
'lang_fr_notes' => 'Good accuracy.',
|
||||
'priv_title' => 'Privacy and data handling',
|
||||
'priv_1' => 'Audio files are uploaded directly to the transcription server and processed in memory. The raw binary is not written to disk.',
|
||||
'priv_2' => 'When Azure Speech or Google Cloud is used, the audio stream is sent to the respective cloud API over HTTPS. Audio is not stored by these providers beyond the duration of the API call (per their standard terms).',
|
||||
'priv_3' => 'When Whisper is used, audio is processed on the ocelot GPU server (SimplePod private cloud, EU). No third-party cloud APIs are called.',
|
||||
'priv_4' => 'If the optional AI cleanup pass is enabled, the transcript text (not audio) is sent to Azure OpenAI.',
|
||||
'priv_5' => 'The transcript itself is not retained on the server unless you explicitly choose to save it. You can save to Min Sak, to your corpus, download as a file, or copy to clipboard — nothing is stored otherwise.',
|
||||
),
|
||||
'no' =>
|
||||
array (
|
||||
'nav_about' => 'Om',
|
||||
'nav_guide' => 'Brukerveiledning',
|
||||
'nav_howit' => 'Slik fungerer det',
|
||||
'nav_opentool' => '← Åpne verktøyet',
|
||||
'nav_signin' => 'Logg inn',
|
||||
'nav_open' => 'Åpne Transkripsjon →',
|
||||
'hero_kicker' => 'Teknisk referanse · Transkripsjon',
|
||||
'hero_title' => 'Slik fungerer Transkripsjon under panseret.',
|
||||
'hero_sub' => 'Tre-motors kaskade, GPU-akselerert Whisper, pyannote.audio-diarisering og valgfritt GPT-4o-opprydding — alt i én pipeline.',
|
||||
'stat_engines' => 'motorer i kaskade',
|
||||
'stat_latency' => 'gj.sn. latens (large-v3)',
|
||||
'stat_wer' => 'ordfeiltall på norsk (Azure)',
|
||||
'stat_speakers' => 'maks. diariseringstalere',
|
||||
'toc_title' => 'Innhold',
|
||||
'toc_1' => 'Arkitektur-oversikt',
|
||||
'toc_2' => 'Motor 1: Azure Batch Speech',
|
||||
'toc_3' => 'Motor 2: Google Cloud Speech-to-Text v2',
|
||||
'toc_4' => 'Motor 3: Whisper GPU (large-v3)',
|
||||
'toc_5' => 'Taler-diarisering',
|
||||
'toc_6' => 'Ordforråd-injeksjon',
|
||||
'toc_7' => 'Etterbehandling: AI-opprydding',
|
||||
'toc_8' => 'Språkstøtte',
|
||||
'toc_9' => 'Personvern og datahåndtering',
|
||||
'arch_title' => 'Arkitektur-oversikt',
|
||||
'arch_intro' => 'Transkripsjon bruker en tre-motors kaskade. Hver motor forsøkes i prioriteringsrekkefølge; hvis primærmotoren er utilgjengelig eller returnerer en feil, faller pipelinen automatisk gjennom til den neste. Dette betyr at en transkripsjon produseres selv under avbrudd i skytjenester.',
|
||||
'arch_cascade_label' => 'Motor-kaskade',
|
||||
'arch_e1' => 'Azure Batch Speech',
|
||||
'arch_e1_sub' => 'Prioritet · Sky · Optimalisert for norsk',
|
||||
'arch_e2' => 'Google Cloud Speech-to-Text v2',
|
||||
'arch_e2_sub' => 'Reserve · Sky · Bred språkstøtte',
|
||||
'arch_e3' => 'Whisper large-v3 (GPU)',
|
||||
'arch_e3_sub' => 'Siste reserve · On-premise GPU · Alltid tilgjengelig',
|
||||
'arch_post1' => 'Taler-diarisering (pyannote.audio)',
|
||||
'arch_post1_sub' => 'Valgfritt · Kjører på GPU-server etter transkripsjon',
|
||||
'arch_post2' => 'AI-opprydding (GPT-4o mini / GPT-4o)',
|
||||
'arch_post2_sub' => 'Valgfritt · Azure OpenAI · Feilretting + terminologi',
|
||||
'e1_title' => 'Motor 1: Azure Batch Speech',
|
||||
'e1_intro' => 'Azure Cognitive Services Speech-to-Text (Batch Transcription API) er primærmotoren. Det er det høyest-nøyaktige alternativet for norsk og brukes for alle produksjonstranskripsioner når det er tilgjengelig.',
|
||||
'e1_model' => 'Modell: <code>nb-NO</code>-lokalitet med tilpasset akustisk modell. Faller tilbake til lokalitetstilpasset modell for andre språk.',
|
||||
'e1_latency' => 'Latens: typisk 0,5–2× sanntid for lyd opptil 200 MB.',
|
||||
'e1_format' => 'Aksepterte formater: alle formater akseptert av Azure (MP3, WAV, OGG, M4A, FLAC, WEBM — konverteres server-side ved behov).',
|
||||
'e1_auth' => 'Autentisering: administrert identitet + abonnementsnøkkel lagret i servermiljøvariabler.',
|
||||
'e2_title' => 'Motor 2: Google Cloud Speech-to-Text v2',
|
||||
'e2_intro' => 'Google Cloud Speech-to-Text v2 (Chirp-modellen) er den andre motoren i kaskaden. Den aktiveres automatisk hvis Azure returnerer en feil eller er utilgjengelig.',
|
||||
'e2_model' => 'Modell: <code>chirp</code> — Googles nyeste store ASR-modell, sterk flerspråklig støtte inkludert norsk, polsk og ukrainsk.',
|
||||
'e2_latency' => 'Latens: sammenlignbar med Azure for de fleste filstørrelser.',
|
||||
'e2_format' => 'Formathåndtering: lyd re-kodes til FLAC før innsending ved behov.',
|
||||
'e3_title' => 'Motor 3: Whisper GPU (large-v3)',
|
||||
'e3_intro' => 'OpenAI Whisper large-v3 kjører på en dedikert GPU-server (ocelot — SimplePod RTX 3060 12 GB på 194.93.49.14:20004). Den er alltid tilgjengelig som den endelige reserveløsningen og har aldri tjenesteavbrudd.',
|
||||
'e3_model' => 'Standardmodell: <code>large-v3</code>. Kan byttes til large-v2, medium, small, base eller tiny i Avanserte alternativer.',
|
||||
'e3_vocab' => 'Ordforråd-injeksjon: <code>initial_prompt</code>-parameteren brukes til å prime Whisper med domene-spesifikke termer før transkripsjon begynner. Dette er en Whisper-native mekanisme — prompten inkluderes ikke i utdataene.',
|
||||
'e3_vad' => 'VAD-filter: når aktivert, bruker <code>vad_filter=True</code>-parameteren Silero VAD til å fjerne stillhet og ikke-tale før behandling.',
|
||||
'e3_latency' => 'Latens: omtrent 2–4× sanntid på RTX 3060. large-v3 på et en-times opptak tar omtrent 15–30 minutter.',
|
||||
'e3_note' => 'Whisper opererer offline — lyd forlater aldri ocelot GPU-serveren når denne motoren brukes. Ingen sky-API-kall foretas.',
|
||||
'diar_title' => 'Taler-diarisering',
|
||||
'diar_intro' => 'Taler-diarisering tilordner hvert segment av transkripsjonen til en taler. Transkripsjon bruker <strong>pyannote.audio</strong>, et Python-bibliotek med åpen kildekode, som kjører som en tjeneste på samme GPU-server som Whisper.',
|
||||
'diar_pipeline' => 'Pipeline: <code>pyannote/speaker-diarization-3.1</code>',
|
||||
'diar_flow' => 'Slik fungerer det:',
|
||||
'diar_f1' => 'Lyden transkriberes først av hvilken motor som er valgt.',
|
||||
'diar_f2' => 'pyannote.audio behandler lyden uavhengig for å oppdage talerturgrenser.',
|
||||
'diar_f3' => 'Whispers ordnivå-tidsstempler (når tilgjengelig) eller segmenttidsstempler justeres med diariseringsutdataene.',
|
||||
'diar_f4' => 'Hver linje merkes deretter på nytt med taler-identiteten: TALER 1, TALER 2 osv.',
|
||||
'diar_count' => 'Talerantall: hvis du oppgir et tall, sendes det som <code>num_speakers</code> til diariseringspipelinen. Hvis det er tomt, bruker pyannote sin standard klyngealgoritme for å estimere antall talere.',
|
||||
'diar_limit' => 'Maksimum: 20 talere. Ytelsen forringes over 6–8 talere i ett enkelt opptak.',
|
||||
'vocab_title' => 'Ordforråd-injeksjon',
|
||||
'vocab_intro' => 'Ordforrådsforhåndsinnstillingsmekanismen fungerer ved å legge domene-spesifikke termer til Whispers <code>initial_prompt</code>-parameter. Dette styrer modellens token-sannsynligheter mot det oppgitte ordforrådet før den behandler lyden.',
|
||||
'vocab_limit' => 'Grense: kombinert forhåndsinnstilling + egendefinert prompt må være ≤ 500 tegn. Lengre prompter avkortes lydløst.',
|
||||
'vocab_builtin' => 'Innebygde forhåndsinnstillinger lagres server-side som strenger og sammenslås med egendefinert tekst fra brukeren. Den endelige prompten sendes direkte til Whisper — den sendes ikke til en LLM og inkluderes ikke i transkripsjonsutdataene.',
|
||||
'vocab_note' => 'Ordforråd-injeksjon påvirker bare Whisper-motoren. Azure Speech og Google Cloud bruker sin egen språkmodell og påvirkes ikke av denne parameteren.',
|
||||
'cleanup_title' => 'Etterbehandling: AI-opprydding',
|
||||
'cleanup_intro' => 'Det valgfrie AI-oppryddingspasset sender råtranskripsjonen til Azure OpenAI for korreksjon. Det transkriberer ikke lyden på nytt — det korrigerer tekstutdataene.',
|
||||
'cleanup_prompt' => 'Systemprompt instruerer modellen om å: fikse ASR-gjenkjenningsfeil (homofonmer, feilhørte ord), normalisere tegnsetting og kapitalisering, korrigere norsk juridisk terminologi, bevare taler-etiketter og tidsstempler nøyaktig, og returnere den korrigerte transkripsjonen i samme format.',
|
||||
'cleanup_mini' => 'GPT-4o mini: <code>gpt-4o-mini</code>-utrulling på Azure. Rask, lav kostnad. Best for rene opptak med mindre feil.',
|
||||
'cleanup_full' => 'GPT-4o: <code>gpt-4o</code>-utrulling på Azure. Tregere, høyere kostnad. Best for støyete opptak eller kompleks domenevokabular.',
|
||||
'cleanup_privacy' => 'Transkripssjonsteksten sendes til Azure OpenAI for dette trinnet. Hvis du velger å ikke kjøre opprydding, forlater transkripsjonen aldri servermiljøet.',
|
||||
'lang_title' => 'Språkstøtte',
|
||||
'lang_intro' => 'Følgende språk er eksplisitt støttet. Andre språk kan fungere via Whispers flerspråklige modell, men er ikke testet eller optimalisert.',
|
||||
'lang_table_lang' => 'Språk',
|
||||
'lang_table_engine' => 'Primærmotor',
|
||||
'lang_table_notes' => 'Notater',
|
||||
'lang_nb' => 'Norsk bokmål',
|
||||
'lang_nb_engine' => 'Azure Speech (nb-NO)',
|
||||
'lang_nb_notes' => 'Beste nøyaktighet. Dedikert norsk akustisk modell.',
|
||||
'lang_nn' => 'Norsk nynorsk',
|
||||
'lang_nn_engine' => 'Azure Speech (nn-NO)',
|
||||
'lang_nn_notes' => 'Azure har en dedikert nn-NO-modell. Whisper-reserve er også sterk.',
|
||||
'lang_en' => 'Engelsk',
|
||||
'lang_en_engine' => 'Azure Speech (en-*)',
|
||||
'lang_en_notes' => 'Utmerket nøyaktighet. Flere regionale lokaliteter tilgjengelig.',
|
||||
'lang_pl' => 'Polsk',
|
||||
'lang_pl_engine' => 'Azure Speech (pl-PL)',
|
||||
'lang_pl_notes' => 'God nøyaktighet. Whisper er også sterk for polsk.',
|
||||
'lang_uk' => 'Ukrainsk',
|
||||
'lang_uk_engine' => 'Google Cloud (uk-UA)',
|
||||
'lang_uk_notes' => 'Azure begrenset støtte; Google Cloud Chirp og Whisper begge sterke.',
|
||||
'lang_sv' => 'Svensk',
|
||||
'lang_sv_engine' => 'Azure Speech (sv-SE)',
|
||||
'lang_sv_notes' => 'God nøyaktighet. Nært beslektet med norsk — lett å forveksle ved auto-deteksjon.',
|
||||
'lang_da' => 'Dansk',
|
||||
'lang_da_engine' => 'Azure Speech (da-DK)',
|
||||
'lang_da_notes' => 'God nøyaktighet.',
|
||||
'lang_de' => 'Tysk',
|
||||
'lang_de_engine' => 'Azure Speech (de-DE)',
|
||||
'lang_de_notes' => 'Utmerket nøyaktighet.',
|
||||
'lang_fr' => 'Fransk',
|
||||
'lang_fr_engine' => 'Azure Speech (fr-FR)',
|
||||
'lang_fr_notes' => 'God nøyaktighet.',
|
||||
'priv_title' => 'Personvern og datahåndtering',
|
||||
'priv_1' => 'Lydfiler lastes direkte opp til transkripssjonsserveren og behandles i minnet. Det rå binære lagres ikke på disk.',
|
||||
'priv_2' => 'Når Azure Speech eller Google Cloud brukes, sendes lydstrømmen til respektive sky-API over HTTPS. Lyd lagres ikke av disse tilbyderne utover varigheten av API-kallet (per standardvilkår).',
|
||||
'priv_3' => 'Når Whisper brukes, behandles lyd på ocelot GPU-serveren (SimplePod privat sky, EU). Ingen tredjeparts sky-API-kall foretas.',
|
||||
'priv_4' => 'Hvis det valgfrie AI-oppryddingspasset er aktivert, sendes transkripsjonsteksten (ikke lyd) til Azure OpenAI.',
|
||||
'priv_5' => 'Transkripsjonen i seg selv beholdes ikke på serveren med mindre du eksplisitt velger å lagre den. Du kan lagre i Min Sak, i korpuset ditt, laste ned som fil, eller kopiere til utklippstavlen — ingenting lagres ellers.',
|
||||
),
|
||||
'uk' =>
|
||||
array (
|
||||
'nav_about' => 'Про інструмент',
|
||||
'nav_guide' => 'Посібник користувача',
|
||||
'nav_howit' => 'Як це працює',
|
||||
'nav_opentool' => '← Відкрити інструмент',
|
||||
'nav_signin' => 'Увійти',
|
||||
'nav_open' => 'Відкрити Транскрипцію →',
|
||||
'hero_kicker' => 'Технічна документація · Транскрипція',
|
||||
'hero_title' => 'Як Транскрипція працює під капотом.',
|
||||
'hero_sub' => 'Каскад трьох систем, GPU-прискорений Whisper, діаризація pyannote.audio та необов'язкове очищення GPT-4o — все в одному конвеєрі.',
|
||||
'stat_engines' => 'систем у каскаді',
|
||||
'stat_latency' => 'сер. затримка (large-v3)',
|
||||
'stat_wer' => 'WER для норвезької (Azure)',
|
||||
'stat_speakers' => 'макс. мовців діаризації',
|
||||
'toc_title' => 'Зміст',
|
||||
'toc_1' => 'Огляд архітектури',
|
||||
'toc_2' => 'Система 1: Azure Batch Speech',
|
||||
'toc_3' => 'Система 2: Google Cloud Speech-to-Text v2',
|
||||
'toc_4' => 'Система 3: Whisper GPU (large-v3)',
|
||||
'toc_5' => 'Діаризація мовців',
|
||||
'toc_6' => 'Ін'єкція словника',
|
||||
'toc_7' => 'Постобробка: очищення AI',
|
||||
'toc_8' => 'Підтримка мов',
|
||||
'toc_9' => 'Конфіденційність та обробка даних',
|
||||
'arch_title' => 'Огляд архітектури',
|
||||
'arch_intro' => 'Транскрипція використовує каскад з трьох систем. Кожна система випробовується в порядку пріоритету; якщо основна система недоступна або повертає помилку, конвеєр автоматично переходить до наступної. Це означає, що транскрипція виробляється навіть під час збоїв хмарних сервісів.',
|
||||
'arch_cascade_label' => 'Каскад систем',
|
||||
'arch_e1' => 'Azure Batch Speech',
|
||||
'arch_e1_sub' => 'Пріоритет · Хмара · Оптимізовано для норвезької',
|
||||
'arch_e2' => 'Google Cloud Speech-to-Text v2',
|
||||
'arch_e2_sub' => 'Резерв · Хмара · Широка підтримка мов',
|
||||
'arch_e3' => 'Whisper large-v3 (GPU)',
|
||||
'arch_e3_sub' => 'Кінцевий резерв · On-premise GPU · Завжди доступний',
|
||||
'arch_post1' => 'Діаризація мовців (pyannote.audio)',
|
||||
'arch_post1_sub' => 'Необов'язково · Виконується на GPU-сервері після транскрипції',
|
||||
'arch_post2' => 'Очищення AI (GPT-4o mini / GPT-4o)',
|
||||
'arch_post2_sub' => 'Необов'язково · Azure OpenAI · Виправлення помилок + термінологія',
|
||||
'e1_title' => 'Система 1: Azure Batch Speech',
|
||||
'e1_intro' => 'Azure Cognitive Services Speech-to-Text (Batch Transcription API) — основна система. Це найточніший варіант для норвезької і використовується для всіх виробничих транскрипцій, коли доступний.',
|
||||
'e1_model' => 'Модель: локаль <code>nb-NO</code> з власною акустичною моделлю. Повертається до моделі, що відповідає локалі, для інших мов.',
|
||||
'e1_latency' => 'Затримка: як правило 0,5–2× реального часу для аудіо до 200 МБ.',
|
||||
'e1_format' => 'Прийняті формати: всі формати, що приймаються Azure (MP3, WAV, OGG, M4A, FLAC, WEBM — конвертуються на стороні сервера за потреби).',
|
||||
'e1_auth' => 'Аутентифікація: керована ідентичність + ключ підписки, збережений у змінних середовища сервера.',
|
||||
'e2_title' => 'Система 2: Google Cloud Speech-to-Text v2',
|
||||
'e2_intro' => 'Google Cloud Speech-to-Text v2 (модель Chirp) — друга система в каскаді. Активується автоматично, якщо Azure повертає помилку або недоступний.',
|
||||
'e2_model' => 'Модель: <code>chirp</code> — остання велика ASR-модель Google, потужна багатомовна підтримка, включаючи норвезьку, польську та українську.',
|
||||
'e2_latency' => 'Затримка: порівнянна з Azure для більшості розмірів файлів.',
|
||||
'e2_format' => 'Обробка форматів: аудіо перекодується у FLAC перед відправкою за потреби.',
|
||||
'e3_title' => 'Система 3: Whisper GPU (large-v3)',
|
||||
'e3_intro' => 'OpenAI Whisper large-v3 працює на виділеному GPU-сервері (ocelot — SimplePod RTX 3060 12 ГБ за адресою 194.93.49.14:20004). Завжди доступний як кінцевий резерв і ніколи не має збоїв сервісу.',
|
||||
'e3_model' => 'Модель за замовчуванням: <code>large-v3</code>. Можна перемкнути на large-v2, medium, small, base або tiny в Розширених параметрах.',
|
||||
'e3_vocab' => 'Ін'єкція словника: параметр <code>initial_prompt</code> використовується для підготовки Whisper з предметно-специфічними термінами перед початком транскрипції. Це нативний механізм Whisper — підказка не включається у вивід.',
|
||||
'e3_vad' => 'Фільтр VAD: коли увімкнено, параметр <code>vad_filter=True</code> використовує Silero VAD для видалення тиші та немовних сегментів перед обробкою.',
|
||||
'e3_latency' => 'Затримка: приблизно 2–4× реального часу на RTX 3060. large-v3 на годинному записі займає приблизно 15–30 хвилин.',
|
||||
'e3_note' => 'Whisper працює офлайн — аудіо ніколи не покидає GPU-сервер ocelot, коли використовується ця система. Хмарні API-виклики не виконуються.',
|
||||
'diar_title' => 'Діаризація мовців',
|
||||
'diar_intro' => 'Діаризація мовців призначає кожен сегмент транскрипції мовцю. Транскрипція використовує <strong>pyannote.audio</strong>, бібліотеку Python з відкритим кодом, що працює як сервіс на тому ж GPU-сервері, що й Whisper.',
|
||||
'diar_pipeline' => 'Конвеєр: <code>pyannote/speaker-diarization-3.1</code>',
|
||||
'diar_flow' => 'Як це працює:',
|
||||
'diar_f1' => 'Аудіо спочатку транскрибується обраною системою.',
|
||||
'diar_f2' => 'pyannote.audio обробляє аудіо незалежно для виявлення меж зміни мовця.',
|
||||
'diar_f3' => 'Мітки часу на рівні слова від Whisper (де доступні) або мітки сегментів вирівнюються з виводом діаризації.',
|
||||
'diar_f4' => 'Кожен рядок потім перемічається ідентичністю мовця: МОВЕЦЬ 1, МОВЕЦЬ 2 тощо.',
|
||||
'diar_count' => 'Кількість мовців: якщо ви вказуєте число, воно передається як <code>num_speakers</code> до конвеєра діаризації. Якщо залишити пустим, pyannote використовує алгоритм кластеризації за замовчуванням для оцінки кількості мовців.',
|
||||
'diar_limit' => 'Максимум: 20 мовців. Продуктивність знижується при понад 6–8 мовцях в одному записі.',
|
||||
'vocab_title' => 'Ін'єкція словника',
|
||||
'vocab_intro' => 'Механізм словникових пресетів працює шляхом додавання предметно-специфічних термінів до параметра <code>initial_prompt</code> Whisper. Це спрямовує ймовірності токенів моделі до наданого словника перед обробкою аудіо.',
|
||||
'vocab_limit' => 'Ліміт: комбінований пресет + власна підказка повинні бути ≤ 500 символів. Довші підказки тихо скорочуються.',
|
||||
'vocab_builtin' => 'Вбудовані пресети зберігаються на стороні сервера як рядки та об'єднуються з будь-яким власним текстом від користувача. Кінцева підказка передається безпосередньо до Whisper — вона не надсилається до LLM і не включається у вивід транскрипції.',
|
||||
'vocab_note' => 'Ін'єкція словника впливає тільки на систему Whisper. Azure Speech і Google Cloud використовують власну мовну модель і не піддаються впливу цього параметра.',
|
||||
'cleanup_title' => 'Постобробка: очищення AI',
|
||||
'cleanup_intro' => 'Необов'язковий прохід очищення AI надсилає необроблену транскрипцію до Azure OpenAI для виправлення. Він не перетранскрибує аудіо — він виправляє текстовий вивід.',
|
||||
'cleanup_prompt' => 'Системна підказка інструктує модель: виправляти помилки розпізнавання ASR (омоніми, неправильно почуті слова), нормалізувати пунктуацію та капіталізацію, виправляти норвезьку юридичну термінологію, зберігати мітки мовців і мітки часу точно, та повертати виправлену транскрипцію в тому ж форматі.',
|
||||
'cleanup_mini' => 'GPT-4o mini: розгортання <code>gpt-4o-mini</code> на Azure. Швидкий, низька вартість. Найкращий для чистих записів з незначними помилками.',
|
||||
'cleanup_full' => 'GPT-4o: розгортання <code>gpt-4o</code> на Azure. Повільніший, вища вартість. Найкращий для зашумлених записів або складної термінології.',
|
||||
'cleanup_privacy' => 'Текст транскрипції надсилається до Azure OpenAI для цього кроку. Якщо ви вирішите не запускати очищення, транскрипція ніколи не покидає серверне середовище.',
|
||||
'lang_title' => 'Підтримка мов',
|
||||
'lang_intro' => 'Наступні мови підтримуються явно. Інші мови можуть працювати через багатомовну модель Whisper, але не тестуються та не оптимізуються.',
|
||||
'lang_table_lang' => 'Мова',
|
||||
'lang_table_engine' => 'Основна система',
|
||||
'lang_table_notes' => 'Примітки',
|
||||
'lang_nb' => 'Норвезька букмол',
|
||||
'lang_nb_engine' => 'Azure Speech (nb-NO)',
|
||||
'lang_nb_notes' => 'Найкраща точність. Виділена норвезька акустична модель.',
|
||||
'lang_nn' => 'Норвезька нюношк',
|
||||
'lang_nn_engine' => 'Azure Speech (nn-NO)',
|
||||
'lang_nn_notes' => 'Azure має виділену модель nn-NO. Резерв Whisper також потужний.',
|
||||
'lang_en' => 'Англійська',
|
||||
'lang_en_engine' => 'Azure Speech (en-*)',
|
||||
'lang_en_notes' => 'Відмінна точність. Доступно кілька регіональних локалей.',
|
||||
'lang_pl' => 'Польська',
|
||||
'lang_pl_engine' => 'Azure Speech (pl-PL)',
|
||||
'lang_pl_notes' => 'Хороша точність. Whisper також потужний для польської.',
|
||||
'lang_uk' => 'Українська',
|
||||
'lang_uk_engine' => 'Google Cloud (uk-UA)',
|
||||
'lang_uk_notes' => 'Обмежена підтримка Azure; Google Cloud Chirp і Whisper обидва потужні.',
|
||||
'lang_sv' => 'Шведська',
|
||||
'lang_sv_engine' => 'Azure Speech (sv-SE)',
|
||||
'lang_sv_notes' => 'Хороша точність. Тісно пов'язана з норвезькою — легко плутати при автовизначенні.',
|
||||
'lang_da' => 'Данська',
|
||||
'lang_da_engine' => 'Azure Speech (da-DK)',
|
||||
'lang_da_notes' => 'Хороша точність.',
|
||||
'lang_de' => 'Німецька',
|
||||
'lang_de_engine' => 'Azure Speech (de-DE)',
|
||||
'lang_de_notes' => 'Відмінна точність.',
|
||||
'lang_fr' => 'Французька',
|
||||
'lang_fr_engine' => 'Azure Speech (fr-FR)',
|
||||
'lang_fr_notes' => 'Хороша точність.',
|
||||
'priv_title' => 'Конфіденційність та обробка даних',
|
||||
'priv_1' => 'Аудіофайли завантажуються безпосередньо на сервер транскрипції та обробляються в пам'яті. Необроблені бінарні дані не записуються на диск.',
|
||||
'priv_2' => 'При використанні Azure Speech або Google Cloud аудіопотік надсилається до відповідного хмарного API через HTTPS. Аудіо не зберігається цими постачальниками поза тривалістю API-виклику (згідно зі стандартними умовами).',
|
||||
'priv_3' => 'При використанні Whisper аудіо обробляється на GPU-сервері ocelot (приватна хмара SimplePod, ЄС). Хмарні API-виклики третіх сторін не виконуються.',
|
||||
'priv_4' => 'Якщо увімкнено необов'язковий прохід очищення AI, текст транскрипції (не аудіо) надсилається до Azure OpenAI.',
|
||||
'priv_5' => 'Сама транскрипція не зберігається на сервері, якщо ви явно не вирішите її зберегти. Ви можете зберегти до Min Sak, до корпусу, завантажити як файл або скопіювати в буфер обміну — в іншому випадку нічого не зберігається.',
|
||||
),
|
||||
'pl' =>
|
||||
array (
|
||||
'nav_about' => 'O narzędziu',
|
||||
'nav_guide' => 'Przewodnik użytkownika',
|
||||
'nav_howit' => 'Jak to działa',
|
||||
'nav_opentool' => '← Otwórz narzędzie',
|
||||
'nav_signin' => 'Zaloguj się',
|
||||
'nav_open' => 'Otwórz Transkrypcję →',
|
||||
'hero_kicker' => 'Dokumentacja techniczna · Transkrypcja',
|
||||
'hero_title' => 'Jak Transkrypcja działa pod maską.',
|
||||
'hero_sub' => 'Kaskada trzech silników, Whisper przyspieszony przez GPU, diaryzacja pyannote.audio i opcjonalne czyszczenie GPT-4o — wszystko w jednym potoku.',
|
||||
'stat_engines' => 'silniki w kaskadzie',
|
||||
'stat_latency' => 'śr. opóźnienie (large-v3)',
|
||||
'stat_wer' => 'WER dla norweskiego (Azure)',
|
||||
'stat_speakers' => 'maks. mówców diaryzacji',
|
||||
'toc_title' => 'Spis treści',
|
||||
'toc_1' => 'Przegląd architektury',
|
||||
'toc_2' => 'Silnik 1: Azure Batch Speech',
|
||||
'toc_3' => 'Silnik 2: Google Cloud Speech-to-Text v2',
|
||||
'toc_4' => 'Silnik 3: Whisper GPU (large-v3)',
|
||||
'toc_5' => 'Diaryzacja mówców',
|
||||
'toc_6' => 'Iniekcja słownika',
|
||||
'toc_7' => 'Postprzetwarzanie: czyszczenie AI',
|
||||
'toc_8' => 'Obsługa języków',
|
||||
'toc_9' => 'Prywatność i obsługa danych',
|
||||
'arch_title' => 'Przegląd architektury',
|
||||
'arch_intro' => 'Transkrypcja używa kaskady trzech silników. Każdy silnik jest próbowany w kolejności priorytetu; jeśli podstawowy silnik jest niedostępny lub zwraca błąd, potok automatycznie przechodzi do następnego. Oznacza to, że transkrypcja jest produkowana nawet podczas awarii usług chmurowych.',
|
||||
'arch_cascade_label' => 'Kaskada silników',
|
||||
'arch_e1' => 'Azure Batch Speech',
|
||||
'arch_e1_sub' => 'Priorytet · Chmura · Zoptymalizowany dla języka norweskiego',
|
||||
'arch_e2' => 'Google Cloud Speech-to-Text v2',
|
||||
'arch_e2_sub' => 'Rezerwa · Chmura · Szeroka obsługa języków',
|
||||
'arch_e3' => 'Whisper large-v3 (GPU)',
|
||||
'arch_e3_sub' => 'Ostatnia rezerwa · On-premise GPU · Zawsze dostępny',
|
||||
'arch_post1' => 'Diaryzacja mówców (pyannote.audio)',
|
||||
'arch_post1_sub' => 'Opcjonalnie · Działa na serwerze GPU po transkrypcji',
|
||||
'arch_post2' => 'Czyszczenie AI (GPT-4o mini / GPT-4o)',
|
||||
'arch_post2_sub' => 'Opcjonalnie · Azure OpenAI · Korekcja błędów + terminologia',
|
||||
'e1_title' => 'Silnik 1: Azure Batch Speech',
|
||||
'e1_intro' => 'Azure Cognitive Services Speech-to-Text (Batch Transcription API) to podstawowy silnik. Jest to najdokładniejsza opcja dla języka norweskiego i jest używana dla wszystkich produkcyjnych transkrypcji gdy jest dostępna.',
|
||||
'e1_model' => 'Model: locale <code>nb-NO</code> z własnym modelem akustycznym. Powraca do modelu dopasowanego do locale dla innych języków.',
|
||||
'e1_latency' => 'Opóźnienie: zazwyczaj 0,5–2× czasu rzeczywistego dla nagrań do 200 MB.',
|
||||
'e1_format' => 'Akceptowane formaty: wszystkie formaty akceptowane przez Azure (MP3, WAV, OGG, M4A, FLAC, WEBM — konwertowane po stronie serwera w razie potrzeby).',
|
||||
'e1_auth' => 'Uwierzytelnianie: zarządzana tożsamość + klucz subskrypcji przechowywany w zmiennych środowiskowych serwera.',
|
||||
'e2_title' => 'Silnik 2: Google Cloud Speech-to-Text v2',
|
||||
'e2_intro' => 'Google Cloud Speech-to-Text v2 (model Chirp) to drugi silnik w kaskadzie. Aktywuje się automatycznie jeśli Azure zwraca błąd lub jest niedostępny.',
|
||||
'e2_model' => 'Model: <code>chirp</code> — najnowszy duży model ASR Google, silna wielojęzyczna obsługa w tym norweskiego, polskiego i ukraińskiego.',
|
||||
'e2_latency' => 'Opóźnienie: porównywalne z Azure dla większości rozmiarów plików.',
|
||||
'e2_format' => 'Obsługa formatów: audio jest re-kodowane do FLAC przed wysłaniem jeśli potrzeba.',
|
||||
'e3_title' => 'Silnik 3: Whisper GPU (large-v3)',
|
||||
'e3_intro' => 'OpenAI Whisper large-v3 działa na dedykowanym serwerze GPU (ocelot — SimplePod RTX 3060 12 GB pod adresem 194.93.49.14:20004). Zawsze dostępny jako ostatnia rezerwa i nigdy nie ma awarii usługi.',
|
||||
'e3_model' => 'Domyślny model: <code>large-v3</code>. Można przełączyć na large-v2, medium, small, base lub tiny w Opcjach zaawansowanych.',
|
||||
'e3_vocab' => 'Iniekcja słownika: parametr <code>initial_prompt</code> jest używany do przygotowania Whispera z terminami specjalistycznymi przed rozpoczęciem transkrypcji. To natywny mechanizm Whispera — podpowiedź nie jest uwzględniana w wynikach.',
|
||||
'e3_vad' => 'Filtr VAD: gdy włączony, parametr <code>vad_filter=True</code> używa Silero VAD do usunięcia ciszy i segmentów bez mowy przed przetwarzaniem.',
|
||||
'e3_latency' => 'Opóźnienie: około 2–4× czasu rzeczywistego na RTX 3060. large-v3 na godzinnym nagraniu zajmuje około 15–30 minut.',
|
||||
'e3_note' => 'Whisper działa offline — audio nigdy nie opuszcza serwera GPU ocelot gdy używany jest ten silnik. Żadne wywołania chmurowych API nie są wykonywane.',
|
||||
'diar_title' => 'Diaryzacja mówców',
|
||||
'diar_intro' => 'Diaryzacja mówców przypisuje każdy segment transkrypcji do mówcy. Transkrypcja używa <strong>pyannote.audio</strong>, biblioteki Python o otwartym kodzie, działającej jako usługa na tym samym serwerze GPU co Whisper.',
|
||||
'diar_pipeline' => 'Potok: <code>pyannote/speaker-diarization-3.1</code>',
|
||||
'diar_flow' => 'Jak to działa:',
|
||||
'diar_f1' => 'Audio jest najpierw transkrybowane przez wybrany silnik.',
|
||||
'diar_f2' => 'pyannote.audio przetwarza audio niezależnie, aby wykryć granice zmian mówców.',
|
||||
'diar_f3' => 'Znaczniki czasu na poziomie słów od Whispera (gdzie dostępne) lub znaczniki segmentów są wyrównywane z wynikami diaryzacji.',
|
||||
'diar_f4' => 'Każda linia jest następnie ponownie oznaczana tożsamością mówcy: MÓWCA 1, MÓWCA 2 itp.',
|
||||
'diar_count' => 'Liczba mówców: jeśli podasz liczbę, jest przekazywana jako <code>num_speakers</code> do potoku diaryzacji. Jeśli pozostawione puste, pyannote używa domyślnego algorytmu klasteryzacji do oszacowania liczby mówców.',
|
||||
'diar_limit' => 'Maksimum: 20 mówców. Wydajność spada powyżej 6–8 mówców w jednym nagraniu.',
|
||||
'vocab_title' => 'Iniekcja słownika',
|
||||
'vocab_intro' => 'Mechanizm predefiniowanych słowników działa poprzez dodanie specjalistycznych terminów do parametru <code>initial_prompt</code> Whispera. Kieruje to prawdopodobieństwami tokenów modelu w stronę dostarczonego słownictwa przed przetwarzaniem audio.',
|
||||
'vocab_limit' => 'Limit: kombinacja predefiniowanego + własnego podpowiedzi musi być ≤ 500 znaków. Dłuższe podpowiedzi są cicho obcinane.',
|
||||
'vocab_builtin' => 'Wbudowane predefiniowane ustawienia są przechowywane po stronie serwera jako ciągi znaków i łączone z dowolnym własnym tekstem wprowadzonym przez użytkownika. Końcowa podpowiedź jest przekazywana bezpośrednio do Whispera — nie jest wysyłana do LLM i nie jest uwzględniana w wynikach transkrypcji.',
|
||||
'vocab_note' => 'Iniekcja słownika wpływa tylko na silnik Whisper. Azure Speech i Google Cloud używają własnego modelu językowego i nie są pod wpływem tego parametru.',
|
||||
'cleanup_title' => 'Postprzetwarzanie: czyszczenie AI',
|
||||
'cleanup_intro' => 'Opcjonalne przejście czyszczenia AI wysyła surową transkrypcję do Azure OpenAI w celu korekty. Nie transkrybuje ponownie audio — poprawia wynik tekstowy.',
|
||||
'cleanup_prompt' => 'Podpowiedź systemowa instruuje model: poprawiać błędy rozpoznawania ASR (homofony, błędnie usłyszane słowa), normalizować interpunkcję i kapitalizację, korygować norweską terminologię prawną, zachowywać etykiety mówców i znaczniki czasu dokładnie oraz zwracać poprawioną transkrypcję w tym samym formacie.',
|
||||
'cleanup_mini' => 'GPT-4o mini: wdrożenie <code>gpt-4o-mini</code> na Azure. Szybki, niski koszt. Najlepszy do czystych nagrań z drobnymi błędami.',
|
||||
'cleanup_full' => 'GPT-4o: wdrożenie <code>gpt-4o</code> na Azure. Wolniejszy, wyższy koszt. Najlepszy do zaszumionych nagrań lub złożonej terminologii.',
|
||||
'cleanup_privacy' => 'Tekst transkrypcji jest wysyłany do Azure OpenAI w tym kroku. Jeśli zdecydujesz się nie uruchamiać czyszczenia, transkrypcja nigdy nie opuszcza środowiska serwerowego.',
|
||||
'lang_title' => 'Obsługa języków',
|
||||
'lang_intro' => 'Następujące języki są jawnie obsługiwane. Inne języki mogą działać przez wielojęzyczny model Whispera, ale nie są testowane ani optymalizowane.',
|
||||
'lang_table_lang' => 'Język',
|
||||
'lang_table_engine' => 'Podstawowy silnik',
|
||||
'lang_table_notes' => 'Uwagi',
|
||||
'lang_nb' => 'Norweski Bokmål',
|
||||
'lang_nb_engine' => 'Azure Speech (nb-NO)',
|
||||
'lang_nb_notes' => 'Najlepsza dokładność. Dedykowany norweski model akustyczny.',
|
||||
'lang_nn' => 'Norweski Nynorsk',
|
||||
'lang_nn_engine' => 'Azure Speech (nn-NO)',
|
||||
'lang_nn_notes' => 'Azure ma dedykowany model nn-NO. Rezerwa Whisper również silna.',
|
||||
'lang_en' => 'Angielski',
|
||||
'lang_en_engine' => 'Azure Speech (en-*)',
|
||||
'lang_en_notes' => 'Doskonała dokładność. Dostępnych kilka regionalnych locale.',
|
||||
'lang_pl' => 'Polski',
|
||||
'lang_pl_engine' => 'Azure Speech (pl-PL)',
|
||||
'lang_pl_notes' => 'Dobra dokładność. Whisper również silny dla polskiego.',
|
||||
'lang_uk' => 'Ukraiński',
|
||||
'lang_uk_engine' => 'Google Cloud (uk-UA)',
|
||||
'lang_uk_notes' => 'Ograniczone wsparcie Azure; Google Cloud Chirp i Whisper obydwa silne.',
|
||||
'lang_sv' => 'Szwedzki',
|
||||
'lang_sv_engine' => 'Azure Speech (sv-SE)',
|
||||
'lang_sv_notes' => 'Dobra dokładność. Ściśle spokrewniony z norweskim — łatwo pomylić przy automatycznym wykrywaniu.',
|
||||
'lang_da' => 'Duński',
|
||||
'lang_da_engine' => 'Azure Speech (da-DK)',
|
||||
'lang_da_notes' => 'Dobra dokładność.',
|
||||
'lang_de' => 'Niemiecki',
|
||||
'lang_de_engine' => 'Azure Speech (de-DE)',
|
||||
'lang_de_notes' => 'Doskonała dokładność.',
|
||||
'lang_fr' => 'Francuski',
|
||||
'lang_fr_engine' => 'Azure Speech (fr-FR)',
|
||||
'lang_fr_notes' => 'Dobra dokładność.',
|
||||
'priv_title' => 'Prywatność i obsługa danych',
|
||||
'priv_1' => 'Pliki audio są przesyłane bezpośrednio na serwer transkrypcji i przetwarzane w pamięci. Surowe dane binarne nie są zapisywane na dysku.',
|
||||
'priv_2' => 'Gdy używany jest Azure Speech lub Google Cloud, strumień audio jest wysyłany do odpowiedniego chmurowego API przez HTTPS. Audio nie jest przechowywane przez tych dostawców poza czasem trwania wywołania API (zgodnie ze standardowymi warunkami).',
|
||||
'priv_3' => 'Gdy używany jest Whisper, audio jest przetwarzane na serwerze GPU ocelot (prywatna chmura SimplePod, UE). Żadne zewnętrzne wywołania chmurowych API nie są wykonywane.',
|
||||
'priv_4' => 'Jeśli opcjonalne przejście czyszczenia AI jest włączone, tekst transkrypcji (nie audio) jest wysyłany do Azure OpenAI.',
|
||||
'priv_5' => 'Sama transkrypcja nie jest zachowywana na serwerze, chyba że wyraźnie zdecydujesz się ją zapisać. Możesz zapisać do Min Sak, do korpusu, pobrać jako plik lub skopiować do schowka — w przeciwnym razie nic nie jest przechowywane.',
|
||||
),
|
||||
);
|
||||
Reference in New Issue
Block a user