Add Transcribe docs (about/guide/tech) + refresh Redact docs
- New: transcribe-about.php, transcribe-guide.php, transcribe-tech.php with full en/no/uk/pl translations (3-engine cascade, diarization, vocab) - New: translations/transcribe-about|guide|tech.php (4-lang strings) - New: scripts/translate-pages.php (Azure gpt-4o CLI translation helper) - Add korr-doc-links nav to transcribe.php - Refresh redact-about|guide|tech.php — point to assets/images/redact/ - Fix all "never written to disk" wording in redact translations - Add Min Sak/corpus save workflow to redact guide and tech privacy section - redact.php upload hint: correct in-memory wording Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -0,0 +1,579 @@
|
||||
<?php
|
||||
return array (
|
||||
'en' =>
|
||||
array (
|
||||
'nav_about' => 'About',
|
||||
'nav_guide' => 'User guide',
|
||||
'nav_howit' => 'How it works',
|
||||
'nav_opentool' => '← Open the tool',
|
||||
'nav_signin' => 'Sign in',
|
||||
'nav_open' => 'Open Transcribe →',
|
||||
'hero_kicker' => 'User Guide · Transcribe',
|
||||
'hero_title' => 'How to use Transcribe.',
|
||||
'hero_sub' => 'A step-by-step walkthrough of every setting — from audio language to AI cleanup — so you get an accurate, speaker-labelled transcript every time.',
|
||||
'toc_title' => 'Contents',
|
||||
'toc_1' => 'Audio language',
|
||||
'toc_2' => 'Speaker identification',
|
||||
'toc_3' => 'Vocabulary presets',
|
||||
'toc_4' => 'Task: Transcribe vs Translate',
|
||||
'toc_5' => 'VAD filter',
|
||||
'toc_6' => 'Whisper model',
|
||||
'toc_7' => 'AI cleanup',
|
||||
'toc_8' => 'Uploading audio',
|
||||
'toc_9' => 'My Audio library',
|
||||
'toc_10' => 'Reading the output',
|
||||
'toc_11' => 'Saving and exporting',
|
||||
'step1_title' => '1. Audio language',
|
||||
'step1_intro' => 'Set this to the language spoken in the recording — not the language you want the output in. Getting this right is the single biggest factor in transcription accuracy.',
|
||||
'step1_table_lang' => 'Language',
|
||||
'step1_table_code' => 'Code',
|
||||
'step1_table_notes' => 'Notes',
|
||||
'step1_nb' => 'Norsk (nb)',
|
||||
'step1_nb_notes' => 'Bokmål. Default for most Norwegian cases.',
|
||||
'step1_nn' => 'Nynorsk',
|
||||
'step1_nn_notes' => 'Select when the speaker uses Nynorsk. Bokmål models handle Nynorsk passably but selecting the correct variant improves accuracy.',
|
||||
'step1_en' => 'English',
|
||||
'step1_en_notes' => 'For English-language recordings or mixed English/Norwegian.',
|
||||
'step1_pl' => 'Polish',
|
||||
'step1_pl_notes' => 'For Polish-speaking parties in a Norwegian case.',
|
||||
'step1_uk' => 'Ukrainian',
|
||||
'step1_uk_notes' => 'For Ukrainian-speaking parties.',
|
||||
'step1_sv' => 'Swedish',
|
||||
'step1_sv_notes' => 'Bokmål and Swedish are closely related; select the correct language to avoid misrecognition.',
|
||||
'step1_da' => 'Danish',
|
||||
'step1_da_notes' => 'Danish.',
|
||||
'step1_de' => 'German',
|
||||
'step1_de_notes' => 'German.',
|
||||
'step1_fr' => 'French',
|
||||
'step1_fr_notes' => 'French.',
|
||||
'step1_auto' => 'Auto-detect',
|
||||
'step1_auto_notes' => 'Let the engine identify the language. May confuse nb/da/sv. Use only when you do not know the language in advance.',
|
||||
'step1_tip' => 'If the recording contains multiple languages, set the dominant language and let auto-detect handle short code-switches.',
|
||||
'step2_title' => '2. Speaker identification',
|
||||
'step2_intro' => 'Speaker identification (diarization) labels each line of the transcript with the speaker who said it. It does not identify who a speaker is by name — it assigns an anonymous label (SPEAKER 1, SPEAKER 2, etc.) and keeps that assignment consistent throughout.',
|
||||
'step2_enable' => 'Enable: check the "Identify speakers" box.',
|
||||
'step2_count' => 'Count: enter the number of expected speakers, or leave blank to let the system auto-detect.',
|
||||
'step2_tip' => 'Setting an exact count generally produces better results than auto-detect when you know how many people are in the recording. For a hearing with a caseworker, a parent, and a lawyer, enter 3.',
|
||||
'step2_limit' => 'Maximum: 20 speakers. For recordings with many voices, auto-detect often works better than setting a high number.',
|
||||
'step3_title' => '3. Vocabulary presets',
|
||||
'step3_intro' => 'Vocabulary presets inject domain-specific terms into the transcription engine as a hint before processing begins. This significantly improves recognition of Norwegian legal terms, proper names, and abbreviations that would otherwise be misheard.',
|
||||
'step3_table_preset' => 'Preset',
|
||||
'step3_table_contains' => 'Contains',
|
||||
'step3_table_use' => 'When to use',
|
||||
'step3_barnerett' => 'Child welfare / CPS',
|
||||
'step3_barnerett_contains' => 'Barnevernet, omsorgsovertakelse, fylkesnemnda, sakkyndig, foreldreansvar, samvær, tilsynsfører…',
|
||||
'step3_barnerett_use' => 'CPS cases, care order hearings, county board proceedings.',
|
||||
'step3_mediation' => 'Mediation / legal meeting',
|
||||
'step3_mediation_contains' => 'Mekling, mekler, avtale, forlik, tingrett, advokat, saksøker, saksøkt…',
|
||||
'step3_mediation_use' => 'Court-mandated mediation, family law negotiations.',
|
||||
'step3_generell' => 'General Norwegian',
|
||||
'step3_generell_contains' => 'Common Norwegian legal and administrative vocabulary, government agency names.',
|
||||
'step3_generell_use' => 'NAV correspondence, general administrative hearings.',
|
||||
'step3_custom' => 'Custom',
|
||||
'step3_custom_contains' => 'Whatever you type in the text field below (max 500 characters).',
|
||||
'step3_custom_use' => 'Unique case names, specialist medical terms, organisation names.',
|
||||
'step3_custom_tip' => 'When using Custom, list terms separated by commas or new lines. Include proper names, unusual place names, and technical jargon. Example: "Kristoffersen, barnevernstjenesten i Stavanger, ADHD, omsorgsovertakelse".',
|
||||
'step4_title' => '4. Task: Transcribe vs Translate',
|
||||
'step4_intro' => 'Found in Advanced options.',
|
||||
'step4_transcribe' => 'Transcribe (default): output the text in the same language as the audio.',
|
||||
'step4_translate' => 'Translate to English: output an English translation of the spoken content. The source language is detected automatically (or use the Audio language setting). Useful when sharing a Norwegian or Ukrainian recording with a non-Norwegian speaker.',
|
||||
'step4_note' => 'Translation is handled by the Whisper model and produces a reasonable but not court-certified translation. For formal legal submissions, use a certified human translator.',
|
||||
'step5_title' => '5. VAD filter',
|
||||
'step5_intro' => 'VAD (Voice Activity Detection) filter removes silence and non-speech segments before transcription. Found in Advanced options.',
|
||||
'step5_when_on' => 'Turn on when: the recording has long pauses, background noise, or is taken from a phone call with hold music.',
|
||||
'step5_when_off' => 'Leave off when: the recording is clean studio audio or a video file where silence carries meaning (e.g. timed pauses in a police interview).',
|
||||
'step5_tip' => 'If you get short, choppy transcripts with missing content, the VAD filter may be cutting real speech. Turn it off.',
|
||||
'step6_title' => '6. Whisper model',
|
||||
'step6_intro' => 'Found in Advanced options. Whisper is used when Azure Speech and Google Cloud are both unavailable. The model choice trades accuracy for speed.',
|
||||
'step6_table_model' => 'Model',
|
||||
'step6_table_speed' => 'Speed',
|
||||
'step6_table_accuracy' => 'Accuracy',
|
||||
'step6_table_use' => 'When to use',
|
||||
'step6_lv3' => 'large-v3',
|
||||
'step6_lv3_speed' => 'Slowest',
|
||||
'step6_lv3_accuracy' => 'Best',
|
||||
'step6_lv3_use' => 'Default. Use for any recording that matters.',
|
||||
'step6_lv2' => 'large-v2',
|
||||
'step6_lv2_speed' => 'Slow',
|
||||
'step6_lv2_accuracy' => 'Excellent',
|
||||
'step6_lv2_use' => 'Slightly faster than v3 with comparable accuracy.',
|
||||
'step6_medium' => 'medium',
|
||||
'step6_medium_speed' => 'Moderate',
|
||||
'step6_medium_accuracy' => 'Good',
|
||||
'step6_medium_use' => 'Longer recordings where speed matters.',
|
||||
'step6_small' => 'small',
|
||||
'step6_small_speed' => 'Fast',
|
||||
'step6_small_accuracy' => 'Fair',
|
||||
'step6_small_use' => 'Quick rough transcripts. Not recommended for legal use.',
|
||||
'step6_base' => 'base',
|
||||
'step6_base_speed' => 'Very fast',
|
||||
'step6_base_accuracy' => 'Poor',
|
||||
'step6_base_use' => 'Testing only.',
|
||||
'step6_tiny' => 'tiny',
|
||||
'step6_tiny_speed' => 'Fastest',
|
||||
'step6_tiny_accuracy' => 'Very poor',
|
||||
'step6_tiny_use' => 'Testing only. Not recommended.',
|
||||
'step6_note' => 'In practice, Azure Speech and Google Cloud are the first two engines tried and both perform excellently for Norwegian. Whisper is the fallback — you rarely need to change this setting.',
|
||||
'step7_title' => '7. AI cleanup',
|
||||
'step7_intro' => 'Found in Advanced options. After the transcript is generated, an optional AI pass corrects recognition errors, normalises punctuation, and fixes domain terminology.',
|
||||
'step7_none' => 'None (default): raw output from the engine. Fastest, lowest cost.',
|
||||
'step7_mini' => 'GPT-4o Mini: fast cleanup pass. Fixes obvious errors, improves punctuation, corrects common misrecognitions. Adds 1 credit.',
|
||||
'step7_full' => 'GPT-4o: deep cleanup pass. Better at domain terminology, ambiguous names, and complex sentence structures. Adds 2 credits.',
|
||||
'step7_tip' => 'For most cases, GPT-4o Mini cleanup is the best value. Run GPT-4o when the recording is noisy or the content involves unusual terminology.',
|
||||
'step8_title' => '8. Uploading audio',
|
||||
'step8_intro' => 'Drag and drop one or more files into the upload zone, or click Browse to select them.',
|
||||
'step8_formats' => 'Supported formats: MP3, WAV, OGG, M4A, FLAC, WEBM.',
|
||||
'step8_size' => 'Maximum file size: 200 MB per file.',
|
||||
'step8_queue' => 'Multiple files: add several files to the queue. They are transcribed sequentially and the results are combined.',
|
||||
'step8_tip' => 'If you have a long hearing split across multiple recordings, add all parts to the queue. The output will include all parts in order.',
|
||||
'step9_title' => '9. My Audio library',
|
||||
'step9_intro' => 'Click "Select from My Audio" to open recordings you have previously uploaded and stored in your account. Stored audio counts against your storage quota.',
|
||||
'step9_save' => 'To save an audio file to My Audio for later use, upload it and check the "Save to My Audio" option in the results panel.',
|
||||
'step10_title' => '10. Reading the output',
|
||||
'step10_intro' => 'Each line of the transcript follows this format:',
|
||||
'step10_format' => '[HH:MM:SS] SPEAKER N: Transcribed text here.',
|
||||
'step10_timestamp' => 'The timestamp marks when the segment starts in the recording.',
|
||||
'step10_speaker' => 'SPEAKER N is the assigned speaker label. When diarization is off, all lines appear without a speaker label.',
|
||||
'step10_confidence' => 'The AI cleanup pass may add [unclear] markers where speech was unintelligible.',
|
||||
'step10_tip' => 'Use the timestamps to cross-reference the transcript against the original recording. If a line seems wrong, play back the corresponding section of the audio.',
|
||||
'step11_title' => '11. Saving and exporting',
|
||||
'step11_intro' => 'Once the transcript appears, you have three options:',
|
||||
'step11_minsak' => 'Save to Min Sak: saves the transcript to your current case file. From there it is available in Timeline, Redact, Korrespond, and other tools as a source document.',
|
||||
'step11_corpus' => 'Save to corpus: saves the transcript to your searchable corpus for use across sessions.',
|
||||
'step11_download' => 'Download: saves the transcript as a plain text file to your computer.',
|
||||
'step11_copy' => 'Copy: copies the full transcript to the clipboard.',
|
||||
'step11_note' => 'Audio is processed in memory and not stored on the server. Nothing is retained unless you choose to save the transcript.',
|
||||
),
|
||||
'no' =>
|
||||
array (
|
||||
'nav_about' => 'Om',
|
||||
'nav_guide' => 'Brukerveiledning',
|
||||
'nav_howit' => 'Slik fungerer det',
|
||||
'nav_opentool' => '← Åpne verktøyet',
|
||||
'nav_signin' => 'Logg inn',
|
||||
'nav_open' => 'Åpne Transkripsjon →',
|
||||
'hero_kicker' => 'Brukerveiledning · Transkripsjon',
|
||||
'hero_title' => 'Hvordan bruke Transkripsjon.',
|
||||
'hero_sub' => 'En steg-for-steg gjennomgang av alle innstillinger — fra lydspråk til AI-opprydding — slik at du får en nøyaktig, taler-merket transkripsjon hver gang.',
|
||||
'toc_title' => 'Innhold',
|
||||
'toc_1' => 'Lydspråk',
|
||||
'toc_2' => 'Taler-identifisering',
|
||||
'toc_3' => 'Ordforrådsforhåndsinnstillinger',
|
||||
'toc_4' => 'Oppgave: Transkripsjon vs. Oversettelse',
|
||||
'toc_5' => 'VAD-filter',
|
||||
'toc_6' => 'Whisper-modell',
|
||||
'toc_7' => 'AI-opprydding',
|
||||
'toc_8' => 'Laste opp lyd',
|
||||
'toc_9' => 'Min lyd-bibliotek',
|
||||
'toc_10' => 'Lese utdataene',
|
||||
'toc_11' => 'Lagring og eksport',
|
||||
'step1_title' => '1. Lydspråk',
|
||||
'step1_intro' => 'Sett dette til språket som snakkes i opptaket — ikke språket du vil ha utdataene på. Å få dette riktig er den viktigste enkeltfaktoren for transkripsjonsøyaktighet.',
|
||||
'step1_table_lang' => 'Språk',
|
||||
'step1_table_code' => 'Kode',
|
||||
'step1_table_notes' => 'Notater',
|
||||
'step1_nb' => 'Norsk (nb)',
|
||||
'step1_nb_notes' => 'Bokmål. Standard for de fleste norske saker.',
|
||||
'step1_nn' => 'Nynorsk',
|
||||
'step1_nn_notes' => 'Velg når taleren bruker nynorsk. Bokmål-modeller håndterer nynorsk passabelt, men å velge riktig variant forbedrer nøyaktigheten.',
|
||||
'step1_en' => 'Engelsk',
|
||||
'step1_en_notes' => 'For engelskspråklige opptak eller blandet engelsk/norsk.',
|
||||
'step1_pl' => 'Polsk',
|
||||
'step1_pl_notes' => 'For polsktalende parter i en norsk sak.',
|
||||
'step1_uk' => 'Ukrainsk',
|
||||
'step1_uk_notes' => 'For ukrainsktalende parter.',
|
||||
'step1_sv' => 'Svensk',
|
||||
'step1_sv_notes' => 'Bokmål og svensk er nært beslektet; velg riktig språk for å unngå feilgjenkjenning.',
|
||||
'step1_da' => 'Dansk',
|
||||
'step1_da_notes' => 'Dansk.',
|
||||
'step1_de' => 'Tysk',
|
||||
'step1_de_notes' => 'Tysk.',
|
||||
'step1_fr' => 'Fransk',
|
||||
'step1_fr_notes' => 'Fransk.',
|
||||
'step1_auto' => 'Auto-deteksjon',
|
||||
'step1_auto_notes' => 'La motoren identifisere språket. Kan forveksle nb/da/sv. Bruk kun når du ikke vet språket på forhånd.',
|
||||
'step1_tip' => 'Hvis opptaket inneholder flere språk, sett det dominerende språket og la auto-deteksjon håndtere korte kodebytter.',
|
||||
'step2_title' => '2. Taler-identifisering',
|
||||
'step2_intro' => 'Taler-identifisering (diarisering) merker hver linje i transkripsjonen med taleren som sa den. Den identifiserer ikke hvem en taler er ved navn — den tildeler en anonym etikett (TALER 1, TALER 2 osv.) og holder denne tildelingen konsistent gjennom hele opptaket.',
|
||||
'step2_enable' => 'Aktiver: merk av «Identifiser talere»-boksen.',
|
||||
'step2_count' => 'Antall: skriv inn antall forventede talere, eller la feltet stå tomt for å la systemet auto-detektere.',
|
||||
'step2_tip' => 'Å angi eksakt antall gir generelt bedre resultater enn auto-deteksjon når du vet hvor mange personer som er i opptaket. For en høring med en saksbehandler, en forelder og en advokat, skriv inn 3.',
|
||||
'step2_limit' => 'Maksimum: 20 talere. For opptak med mange stemmer fungerer auto-deteksjon ofte bedre enn å angi et høyt tall.',
|
||||
'step3_title' => '3. Ordforrådsforhåndsinnstillinger',
|
||||
'step3_intro' => 'Ordforrådsforhåndsinnstillinger injiserer domene-spesifikke termer i transkripsjonsmotoren som et hint før behandlingen begynner. Dette forbedrer vesentlig gjenkjenning av norske juridiske termer, egennavn og forkortelser som ellers ville blitt hørt feil.',
|
||||
'step3_table_preset' => 'Forhåndsinnstilling',
|
||||
'step3_table_contains' => 'Inneholder',
|
||||
'step3_table_use' => 'Når du skal bruke',
|
||||
'step3_barnerett' => 'Barnevern / BV',
|
||||
'step3_barnerett_contains' => 'Barnevernet, omsorgsovertakelse, fylkesnemnda, sakkyndig, foreldreansvar, samvær, tilsynsfører…',
|
||||
'step3_barnerett_use' => 'Barnevernsaker, høringer om omsorgsovertakelse, fylkesnemndsbehandling.',
|
||||
'step3_mediation' => 'Mekling / juridisk møte',
|
||||
'step3_mediation_contains' => 'Mekling, mekler, avtale, forlik, tingrett, advokat, saksøker, saksøkt…',
|
||||
'step3_mediation_use' => 'Rettslig mekling, forhandlinger i familierett.',
|
||||
'step3_generell' => 'Generell norsk',
|
||||
'step3_generell_contains' => 'Vanlig norsk juridisk og administrativt ordforråd, offentlige etatsnavne.',
|
||||
'step3_generell_use' => 'NAV-korrespondanse, alminnelige administrative høringer.',
|
||||
'step3_custom' => 'Egendefinert',
|
||||
'step3_custom_contains' => 'Hva du skriver i tekstfeltet nedenfor (maks 500 tegn).',
|
||||
'step3_custom_use' => 'Unike saksnavn, spesialiserte medisinske termer, organisasjonsnavn.',
|
||||
'step3_custom_tip' => 'Når du bruker Egendefinert, list opp termer atskilt med komma eller linjeskift. Inkluder egennavn, uvanlige stedsnavn og fagspråk. Eksempel: «Kristoffersen, barnevernstjenesten i Stavanger, ADHD, omsorgsovertakelse».',
|
||||
'step4_title' => '4. Oppgave: Transkripsjon vs. Oversettelse',
|
||||
'step4_intro' => 'Finnes i Avanserte alternativer.',
|
||||
'step4_transcribe' => 'Transkripsjon (standard): utdata på samme språk som lyden.',
|
||||
'step4_translate' => 'Oversett til engelsk: utdata som en engelsk oversettelse av det talte innholdet. Kildespråket oppdages automatisk (eller bruk Lydspråk-innstillingen). Nyttig ved deling av et norsk eller ukrainsk opptak med en ikke-norsktalende.',
|
||||
'step4_note' => 'Oversettelse håndteres av Whisper-modellen og gir en rimelig, men ikke rettslig sertifisert oversettelse. For formelle juridiske innleveringer, bruk en sertifisert menneskelig oversetter.',
|
||||
'step5_title' => '5. VAD-filter',
|
||||
'step5_intro' => 'VAD (Voice Activity Detection) filter fjerner stillhet og ikke-talte segmenter før transkripsjon. Finnes i Avanserte alternativer.',
|
||||
'step5_when_on' => 'Slå på når: opptaket har lange pauser, bakgrunnsstøy, eller er tatt fra et telefonsamtale med ventemusikk.',
|
||||
'step5_when_off' => 'La stå av når: opptaket er rent studiolyden eller en videofil der stillhet har betydning (f.eks. tidsbestemte pauser i et politiintervju).',
|
||||
'step5_tip' => 'Hvis du får korte, hakkete transkripsjoner med manglende innhold, kan VAD-filteret kutte ekte tale. Slå det av.',
|
||||
'step6_title' => '6. Whisper-modell',
|
||||
'step6_intro' => 'Finnes i Avanserte alternativer. Whisper brukes når Azure Speech og Google Cloud begge er utilgjengelige. Modellvalget avveier nøyaktighet mot hastighet.',
|
||||
'step6_table_model' => 'Modell',
|
||||
'step6_table_speed' => 'Hastighet',
|
||||
'step6_table_accuracy' => 'Nøyaktighet',
|
||||
'step6_table_use' => 'Når du skal bruke',
|
||||
'step6_lv3' => 'large-v3',
|
||||
'step6_lv3_speed' => 'Tregeste',
|
||||
'step6_lv3_accuracy' => 'Best',
|
||||
'step6_lv3_use' => 'Standard. Bruk for ethvert opptak som er viktig.',
|
||||
'step6_lv2' => 'large-v2',
|
||||
'step6_lv2_speed' => 'Treg',
|
||||
'step6_lv2_accuracy' => 'Utmerket',
|
||||
'step6_lv2_use' => 'Litt raskere enn v3 med sammenlignbar nøyaktighet.',
|
||||
'step6_medium' => 'medium',
|
||||
'step6_medium_speed' => 'Moderat',
|
||||
'step6_medium_accuracy' => 'God',
|
||||
'step6_medium_use' => 'Lengre opptak der hastighet betyr noe.',
|
||||
'step6_small' => 'small',
|
||||
'step6_small_speed' => 'Rask',
|
||||
'step6_small_accuracy' => 'Passabel',
|
||||
'step6_small_use' => 'Raske grove transkripsjoner. Ikke anbefalt til juridisk bruk.',
|
||||
'step6_base' => 'base',
|
||||
'step6_base_speed' => 'Veldig rask',
|
||||
'step6_base_accuracy' => 'Svak',
|
||||
'step6_base_use' => 'Kun testing.',
|
||||
'step6_tiny' => 'tiny',
|
||||
'step6_tiny_speed' => 'Raskest',
|
||||
'step6_tiny_accuracy' => 'Svært svak',
|
||||
'step6_tiny_use' => 'Kun testing. Ikke anbefalt.',
|
||||
'step6_note' => 'I praksis forsøkes Azure Speech og Google Cloud som de to første motorene, og begge presterer utmerket for norsk. Whisper er reserveløsningen — du trenger sjelden å endre denne innstillingen.',
|
||||
'step7_title' => '7. AI-opprydding',
|
||||
'step7_intro' => 'Finnes i Avanserte alternativer. Etter at transkripsjonen er generert, korrigerer et valgfritt AI-pass gjenkjenningsfeil, normaliserer tegnsetting og fikser domeneterminologi.',
|
||||
'step7_none' => 'Ingen (standard): rå utdata fra motoren. Raskest, lavest kostnad.',
|
||||
'step7_mini' => 'GPT-4o Mini: raskt oppryddingspass. Fikser åpenbare feil, forbedrer tegnsetting, korrigerer vanlige feiltolkninger. Legger til 1 kreditt.',
|
||||
'step7_full' => 'GPT-4o: dypt oppryddingspass. Bedre på domeneterminologi, tvetydige navn og komplekse setningsstrukturer. Legger til 2 kreditter.',
|
||||
'step7_tip' => 'For de fleste saker er GPT-4o Mini-opprydding den beste verdien. Kjør GPT-4o når opptaket er støyete eller innholdet involverer uvanlig terminologi.',
|
||||
'step8_title' => '8. Laste opp lyd',
|
||||
'step8_intro' => 'Dra og slipp én eller flere filer i opplastningssonen, eller klikk Bla gjennom for å velge dem.',
|
||||
'step8_formats' => 'Støttede formater: MP3, WAV, OGG, M4A, FLAC, WEBM.',
|
||||
'step8_size' => 'Maksimal filstørrelse: 200 MB per fil.',
|
||||
'step8_queue' => 'Flere filer: legg til flere filer i køen. De transkriberes sekvensielt og resultatene kombineres.',
|
||||
'step8_tip' => 'Hvis du har en lang høring fordelt på flere opptak, legg til alle deler i køen. Utdataene vil inneholde alle deler i rekkefølge.',
|
||||
'step9_title' => '9. Min lyd-bibliotek',
|
||||
'step9_intro' => 'Klikk «Velg fra Min Lyd» for å åpne opptak du tidligere har lastet opp og lagret i kontoen din. Lagret lyd teller mot lagringskvoten din.',
|
||||
'step9_save' => 'For å lagre en lydfil til Min Lyd for senere bruk, last den opp og merk «Lagre i Min Lyd»-alternativet i resultatpanelet.',
|
||||
'step10_title' => '10. Lese utdataene',
|
||||
'step10_intro' => 'Hver linje i transkripsjonen følger dette formatet:',
|
||||
'step10_format' => '[TT:MM:SS] TALER N: Transkribert tekst her.',
|
||||
'step10_timestamp' => 'Tidsstemplet markerer når segmentet starter i opptaket.',
|
||||
'step10_speaker' => 'TALER N er den tildelte talermerket. Når diarisering er av, vises alle linjer uten taleretikett.',
|
||||
'step10_confidence' => 'AI-oppryddingspasset kan legge til [uklar]-markører der tale var uforståelig.',
|
||||
'step10_tip' => 'Bruk tidsstemplene til å kryssreferere transkripsjonen mot det originale opptaket. Hvis en linje virker feil, spill av den tilsvarende delen av lyden.',
|
||||
'step11_title' => '11. Lagring og eksport',
|
||||
'step11_intro' => 'Når transkripsjonen vises, har du tre alternativer:',
|
||||
'step11_minsak' => 'Lagre i Min Sak: lagrer transkripsjonen i din nåværende saksfil. Derfra er den tilgjengelig i Tidslinje, Sladding, Korrespondanse og andre verktøy som et kildedokument.',
|
||||
'step11_corpus' => 'Lagre i korpus: lagrer transkripsjonen i ditt søkbare korpus for bruk på tvers av sesjoner.',
|
||||
'step11_download' => 'Last ned: lagrer transkripsjonen som en ren tekstfil på datamaskinen din.',
|
||||
'step11_copy' => 'Kopier: kopierer hele transkripsjonen til utklippstavlen.',
|
||||
'step11_note' => 'Lyd behandles i minnet og lagres ikke på serveren. Ingenting beholdes med mindre du velger å lagre transkripsjonen.',
|
||||
),
|
||||
'uk' =>
|
||||
array (
|
||||
'nav_about' => 'Про інструмент',
|
||||
'nav_guide' => 'Посібник користувача',
|
||||
'nav_howit' => 'Як це працює',
|
||||
'nav_opentool' => '← Відкрити інструмент',
|
||||
'nav_signin' => 'Увійти',
|
||||
'nav_open' => 'Відкрити Транскрипцію →',
|
||||
'hero_kicker' => 'Посібник користувача · Транскрипція',
|
||||
'hero_title' => 'Як користуватись Транскрипцією.',
|
||||
'hero_sub' => 'Покрокове пояснення кожного налаштування — від мови аудіо до очищення AI — щоб ви щоразу отримували точну транскрипцію з позначенням мовців.',
|
||||
'toc_title' => 'Зміст',
|
||||
'toc_1' => 'Мова аудіо',
|
||||
'toc_2' => 'Ідентифікація мовців',
|
||||
'toc_3' => 'Словникові пресети',
|
||||
'toc_4' => 'Завдання: Транскрипція vs Переклад',
|
||||
'toc_5' => 'Фільтр VAD',
|
||||
'toc_6' => 'Модель Whisper',
|
||||
'toc_7' => 'Очищення AI',
|
||||
'toc_8' => 'Завантаження аудіо',
|
||||
'toc_9' => 'Бібліотека Моє аудіо',
|
||||
'toc_10' => 'Читання результату',
|
||||
'toc_11' => 'Збереження та експорт',
|
||||
'step1_title' => '1. Мова аудіо',
|
||||
'step1_intro' => 'Встановіть мову запису — не мову, якою ви хочете отримати результат. Правильне налаштування — найважливіший фактор точності транскрипції.',
|
||||
'step1_table_lang' => 'Мова',
|
||||
'step1_table_code' => 'Код',
|
||||
'step1_table_notes' => 'Примітки',
|
||||
'step1_nb' => 'Норвезька (nb)',
|
||||
'step1_nb_notes' => 'Букмол. За замовчуванням для більшості норвезьких справ.',
|
||||
'step1_nn' => 'Нюношк',
|
||||
'step1_nn_notes' => 'Вибирайте, коли мовець використовує нюношк. Моделі букмолу прийнятно обробляють нюношк, але вибір правильного варіанту покращує точність.',
|
||||
'step1_en' => 'Англійська',
|
||||
'step1_en_notes' => 'Для записів англійською або змішаних англійсько-норвезьких.',
|
||||
'step1_pl' => 'Польська',
|
||||
'step1_pl_notes' => 'Для польськомовних сторін у норвезькій справі.',
|
||||
'step1_uk' => 'Українська',
|
||||
'step1_uk_notes' => 'Для україномовних сторін.',
|
||||
'step1_sv' => 'Шведська',
|
||||
'step1_sv_notes' => 'Букмол і шведська тісно пов'язані; вибирайте правильну мову, щоб уникнути хибного розпізнавання.',
|
||||
'step1_da' => 'Данська',
|
||||
'step1_da_notes' => 'Данська.',
|
||||
'step1_de' => 'Німецька',
|
||||
'step1_de_notes' => 'Німецька.',
|
||||
'step1_fr' => 'Французька',
|
||||
'step1_fr_notes' => 'Французька.',
|
||||
'step1_auto' => 'Автовизначення',
|
||||
'step1_auto_notes' => 'Система визначає мову автоматично. Може плутати nb/da/sv. Використовуйте лише коли мова невідома заздалегідь.',
|
||||
'step1_tip' => 'Якщо запис містить кілька мов, встановіть домінуючу мову і дозвольте автовизначенню обробляти короткі перемикання мови.',
|
||||
'step2_title' => '2. Ідентифікація мовців',
|
||||
'step2_intro' => 'Ідентифікація мовців (діаризація) позначає кожен рядок транскрипції мовцем, який його вимовив. Вона не визначає особу мовця за іменем — призначає анонімну мітку (МОВЕЦЬ 1, МОВЕЦЬ 2 тощо) і зберігає це призначення протягом усього запису.',
|
||||
'step2_enable' => 'Увімкнути: позначте поле «Ідентифікувати мовців».',
|
||||
'step2_count' => 'Кількість: введіть очікувану кількість мовців або залиште пусте поле для автовизначення системою.',
|
||||
'step2_tip' => 'Точна кількість зазвичай дає кращі результати, ніж автовизначення, коли ви знаєте, скільки людей у записі. Для слухання з соціальним працівником, батьком і адвокатом введіть 3.',
|
||||
'step2_limit' => 'Максимум: 20 мовців. Для записів з багатьма голосами автовизначення часто працює краще, ніж встановлення великого числа.',
|
||||
'step3_title' => '3. Словникові пресети',
|
||||
'step3_intro' => 'Словникові пресети вводять специфічні терміни в систему транскрипції як підказку перед початком обробки. Це значно покращує розпізнавання норвезьких правових термінів, власних назв та абревіатур.',
|
||||
'step3_table_preset' => 'Пресет',
|
||||
'step3_table_contains' => 'Містить',
|
||||
'step3_table_use' => 'Коли використовувати',
|
||||
'step3_barnerett' => 'Захист дітей / БВ',
|
||||
'step3_barnerett_contains' => 'Barnevernet, omsorgsovertakelse, fylkesnemnda, sakkyndig, foreldreansvar, samvær, tilsynsfører…',
|
||||
'step3_barnerett_use' => 'Справи захисту дітей, слухання щодо опіки, провадження у раді округу.',
|
||||
'step3_mediation' => 'Медіація / юридична нарада',
|
||||
'step3_mediation_contains' => 'Mekling, mekler, avtale, forlik, tingrett, advokat, saksøker, saksøkt…',
|
||||
'step3_mediation_use' => 'Судова медіація, переговори з сімейного права.',
|
||||
'step3_generell' => 'Загальна норвезька',
|
||||
'step3_generell_contains' => 'Поширена норвезька юридична та адміністративна лексика, назви державних органів.',
|
||||
'step3_generell_use' => 'Кореспонденція NAV, загальні адміністративні слухання.',
|
||||
'step3_custom' => 'Власний',
|
||||
'step3_custom_contains' => 'Що ви вводите в текстове поле нижче (макс. 500 символів).',
|
||||
'step3_custom_use' => 'Унікальні назви справ, спеціалізовані медичні терміни, назви організацій.',
|
||||
'step3_custom_tip' => 'При використанні Власного пресету перераховуйте терміни через кому або з нового рядка. Включайте власні назви, незвичайні топоніми та технічний жаргон. Приклад: «Kristoffersen, barnevernstjenesten i Stavanger, ADHD, omsorgsovertakelse».',
|
||||
'step4_title' => '4. Завдання: Транскрипція vs Переклад',
|
||||
'step4_intro' => 'Знаходиться в Розширених параметрах.',
|
||||
'step4_transcribe' => 'Транскрипція (за замовчуванням): виводить текст тією ж мовою, що й аудіо.',
|
||||
'step4_translate' => 'Перекласти на англійську: виводить англійський переклад усного контенту. Мова джерела визначається автоматично (або використовуйте налаштування Мова аудіо). Корисно при передачі норвезького або українського запису не норвежськомовній особі.',
|
||||
'step4_note' => 'Переклад виконується моделлю Whisper і дає прийнятний, але не юридично сертифікований переклад. Для офіційних юридичних подань використовуйте сертифікованого перекладача-людину.',
|
||||
'step5_title' => '5. Фільтр VAD',
|
||||
'step5_intro' => 'Фільтр VAD (Виявлення голосової активності) видаляє тишу та неголосові сегменти перед транскрипцією. Знаходиться в Розширених параметрах.',
|
||||
'step5_when_on' => 'Вмикайте, коли: запис має довгі паузи, фоновий шум або знятий з телефонного дзвінка з очікувальною музикою.',
|
||||
'step5_when_off' => 'Залишайте вимкненим, коли: запис — чисте студійне аудіо або відеофайл, де тиша має значення (напр. паузи в поліцейському допиті).',
|
||||
'step5_tip' => 'Якщо ви отримуєте короткі, уривчасті транскрипції з відсутнім вмістом, фільтр VAD може обрізати справжнє мовлення. Вимкніть його.',
|
||||
'step6_title' => '6. Модель Whisper',
|
||||
'step6_intro' => 'Знаходиться в Розширених параметрах. Whisper використовується, коли Azure Speech і Google Cloud недоступні. Вибір моделі визначає компроміс між точністю та швидкістю.',
|
||||
'step6_table_model' => 'Модель',
|
||||
'step6_table_speed' => 'Швидкість',
|
||||
'step6_table_accuracy' => 'Точність',
|
||||
'step6_table_use' => 'Коли використовувати',
|
||||
'step6_lv3' => 'large-v3',
|
||||
'step6_lv3_speed' => 'Найповільніша',
|
||||
'step6_lv3_accuracy' => 'Найкраща',
|
||||
'step6_lv3_use' => 'За замовчуванням. Для будь-якого важливого запису.',
|
||||
'step6_lv2' => 'large-v2',
|
||||
'step6_lv2_speed' => 'Повільна',
|
||||
'step6_lv2_accuracy' => 'Відмінна',
|
||||
'step6_lv2_use' => 'Дещо швидша за v3 з подібною точністю.',
|
||||
'step6_medium' => 'medium',
|
||||
'step6_medium_speed' => 'Помірна',
|
||||
'step6_medium_accuracy' => 'Хороша',
|
||||
'step6_medium_use' => 'Довші записи, де важлива швидкість.',
|
||||
'step6_small' => 'small',
|
||||
'step6_small_speed' => 'Швидка',
|
||||
'step6_small_accuracy' => 'Задовільна',
|
||||
'step6_small_use' => 'Швидкі чернетки транскрипцій. Не рекомендується для юридичного використання.',
|
||||
'step6_base' => 'base',
|
||||
'step6_base_speed' => 'Дуже швидка',
|
||||
'step6_base_accuracy' => 'Погана',
|
||||
'step6_base_use' => 'Тільки для тестування.',
|
||||
'step6_tiny' => 'tiny',
|
||||
'step6_tiny_speed' => 'Найшвидша',
|
||||
'step6_tiny_accuracy' => 'Дуже погана',
|
||||
'step6_tiny_use' => 'Тільки для тестування. Не рекомендується.',
|
||||
'step6_note' => 'На практиці Azure Speech і Google Cloud випробовуються першими і обидві відмінно працюють для норвезької. Whisper — резервний варіант; вам рідко потрібно змінювати це налаштування.',
|
||||
'step7_title' => '7. Очищення AI',
|
||||
'step7_intro' => 'Знаходиться в Розширених параметрах. Після генерації транскрипції необов'язковий прохід AI виправляє помилки розпізнавання, нормалізує пунктуацію та виправляє термінологію.',
|
||||
'step7_none' => 'Немає (за замовчуванням): необроблений вивід від системи. Найшвидший, найдешевший.',
|
||||
'step7_mini' => 'GPT-4o Mini: швидкий прохід очищення. Виправляє очевидні помилки, покращує пунктуацію, коригує поширені хибні розпізнавання. Додає 1 кредит.',
|
||||
'step7_full' => 'GPT-4o: глибокий прохід очищення. Краще обробляє термінологію, неоднозначні імена та складні структури речень. Додає 2 кредити.',
|
||||
'step7_tip' => 'Для більшості справ очищення GPT-4o Mini — найкраще співвідношення ціна/якість. Запускайте GPT-4o, коли запис зашумлений або вміст містить незвичайну термінологію.',
|
||||
'step8_title' => '8. Завантаження аудіо',
|
||||
'step8_intro' => 'Перетягніть один або кілька файлів у зону завантаження або натисніть Огляд для вибору.',
|
||||
'step8_formats' => 'Підтримувані формати: MP3, WAV, OGG, M4A, FLAC, WEBM.',
|
||||
'step8_size' => 'Максимальний розмір файлу: 200 МБ на файл.',
|
||||
'step8_queue' => 'Кілька файлів: додайте кілька файлів у чергу. Вони транскрибуються послідовно, а результати об'єднуються.',
|
||||
'step8_tip' => 'Якщо у вас тривале слухання, розподілене на кілька записів, додайте всі частини в чергу. Результат міститиме всі частини по порядку.',
|
||||
'step9_title' => '9. Бібліотека Моє аудіо',
|
||||
'step9_intro' => 'Натисніть «Вибрати з Моє аудіо», щоб відкрити записи, які ви раніше завантажили та зберегли в обліковому записі. Збережене аудіо зараховується до вашої квоти сховища.',
|
||||
'step9_save' => 'Щоб зберегти аудіофайл у Моє аудіо для подальшого використання, завантажте його та позначте параметр «Зберегти в Моє аудіо» в панелі результатів.',
|
||||
'step10_title' => '10. Читання результату',
|
||||
'step10_intro' => 'Кожен рядок транскрипції має такий формат:',
|
||||
'step10_format' => '[ГГ:ХХ:СС] МОВЕЦЬ N: Транскрибований текст тут.',
|
||||
'step10_timestamp' => 'Мітка часу позначає початок сегменту в записі.',
|
||||
'step10_speaker' => 'МОВЕЦЬ N — призначена мітка мовця. Коли діаризація вимкнена, всі рядки відображаються без мітки мовця.',
|
||||
'step10_confidence' => 'Прохід очищення AI може додавати маркери [нерозбірливо], де мовлення було незрозумілим.',
|
||||
'step10_tip' => 'Використовуйте мітки часу для перехресної перевірки транскрипції з оригінальним записом. Якщо рядок здається неправильним, відтворіть відповідний розділ аудіо.',
|
||||
'step11_title' => '11. Збереження та експорт',
|
||||
'step11_intro' => 'Коли з'явиться транскрипція, у вас є три варіанти:',
|
||||
'step11_minsak' => 'Зберегти до Min Sak: зберігає транскрипцію до вашого поточного файлу справи. Звідти вона доступна у Хронологія, Редагування, Кореспонденція та інших інструментах як вихідний документ.',
|
||||
'step11_corpus' => 'Зберегти до корпусу: зберігає транскрипцію до вашого корпусу з можливістю пошуку для використання між сесіями.',
|
||||
'step11_download' => 'Завантажити: зберігає транскрипцію як текстовий файл на ваш комп'ютер.',
|
||||
'step11_copy' => 'Копіювати: копіює всю транскрипцію в буфер обміну.',
|
||||
'step11_note' => 'Аудіо обробляється в пам'яті і не зберігається на сервері. Нічого не зберігається, якщо ви не вирішите зберегти транскрипцію.',
|
||||
),
|
||||
'pl' =>
|
||||
array (
|
||||
'nav_about' => 'O narzędziu',
|
||||
'nav_guide' => 'Przewodnik użytkownika',
|
||||
'nav_howit' => 'Jak to działa',
|
||||
'nav_opentool' => '← Otwórz narzędzie',
|
||||
'nav_signin' => 'Zaloguj się',
|
||||
'nav_open' => 'Otwórz Transkrypcję →',
|
||||
'hero_kicker' => 'Przewodnik użytkownika · Transkrypcja',
|
||||
'hero_title' => 'Jak korzystać z Transkrypcji.',
|
||||
'hero_sub' => 'Krok po kroku przez każde ustawienie — od języka nagrania do czyszczenia AI — aby za każdym razem otrzymać dokładną transkrypcję z oznaczeniem mówców.',
|
||||
'toc_title' => 'Spis treści',
|
||||
'toc_1' => 'Język nagrania',
|
||||
'toc_2' => 'Identyfikacja mówców',
|
||||
'toc_3' => 'Predefiniowane słowniki',
|
||||
'toc_4' => 'Zadanie: Transkrypcja vs Tłumaczenie',
|
||||
'toc_5' => 'Filtr VAD',
|
||||
'toc_6' => 'Model Whisper',
|
||||
'toc_7' => 'Czyszczenie AI',
|
||||
'toc_8' => 'Przesyłanie nagrania',
|
||||
'toc_9' => 'Biblioteka Moje nagrania',
|
||||
'toc_10' => 'Odczytywanie wyników',
|
||||
'toc_11' => 'Zapisywanie i eksport',
|
||||
'step1_title' => '1. Język nagrania',
|
||||
'step1_intro' => 'Ustaw język mówiony w nagraniu — nie język, w którym chcesz otrzymać wynik. Poprawne ustawienie jest najważniejszym czynnikiem dokładności transkrypcji.',
|
||||
'step1_table_lang' => 'Język',
|
||||
'step1_table_code' => 'Kod',
|
||||
'step1_table_notes' => 'Uwagi',
|
||||
'step1_nb' => 'Norweski (nb)',
|
||||
'step1_nb_notes' => 'Bokmål. Domyślny dla większości spraw norweskich.',
|
||||
'step1_nn' => 'Nynorsk',
|
||||
'step1_nn_notes' => 'Wybierz, gdy mówca używa Nynorsk. Modele Bokmål obsługują Nynorsk znośnie, ale wybór właściwego wariantu poprawia dokładność.',
|
||||
'step1_en' => 'Angielski',
|
||||
'step1_en_notes' => 'Dla nagrań anglojęzycznych lub mieszanych angielsko-norweskich.',
|
||||
'step1_pl' => 'Polski',
|
||||
'step1_pl_notes' => 'Dla polskojęzycznych stron w sprawie norweskiej.',
|
||||
'step1_uk' => 'Ukraiński',
|
||||
'step1_uk_notes' => 'Dla ukraińskojęzycznych stron.',
|
||||
'step1_sv' => 'Szwedzki',
|
||||
'step1_sv_notes' => 'Bokmål i szwedzki są ściśle spokrewnione; wybierz właściwy język, aby uniknąć błędów rozpoznawania.',
|
||||
'step1_da' => 'Duński',
|
||||
'step1_da_notes' => 'Duński.',
|
||||
'step1_de' => 'Niemiecki',
|
||||
'step1_de_notes' => 'Niemiecki.',
|
||||
'step1_fr' => 'Francuski',
|
||||
'step1_fr_notes' => 'Francuski.',
|
||||
'step1_auto' => 'Automatyczne wykrywanie',
|
||||
'step1_auto_notes' => 'System wykrywa język automatycznie. Może mylić nb/da/sv. Używaj tylko gdy nie znasz języka nagrania z góry.',
|
||||
'step1_tip' => 'Jeśli nagranie zawiera wiele języków, ustaw dominujący język i pozwól automatycznemu wykrywaniu obsługiwać krótkie przełączenia.',
|
||||
'step2_title' => '2. Identyfikacja mówców',
|
||||
'step2_intro' => 'Identyfikacja mówców (diaryzacja) przypisuje każdą linię transkrypcji do mówcy, który ją wypowiedział. Nie identyfikuje, kim jest mówca z imienia — przypisuje anonimową etykietę (MÓWCA 1, MÓWCA 2 itp.) i utrzymuje to przypisanie przez cały czas.',
|
||||
'step2_enable' => 'Włącz: zaznacz pole «Identyfikuj mówców».',
|
||||
'step2_count' => 'Liczba: wprowadź oczekiwaną liczbę mówców lub pozostaw puste, aby system wykrył automatycznie.',
|
||||
'step2_tip' => 'Ustawienie dokładnej liczby zazwyczaj daje lepsze wyniki niż automatyczne wykrywanie, gdy wiesz ile osób jest w nagraniu. Dla przesłuchania z pracownikiem socjalnym, rodzicem i prawnikiem wprowadź 3.',
|
||||
'step2_limit' => 'Maksimum: 20 mówców. Dla nagrań z wieloma głosami automatyczne wykrywanie często działa lepiej niż ustawianie dużej liczby.',
|
||||
'step3_title' => '3. Predefiniowane słowniki',
|
||||
'step3_intro' => 'Predefiniowane słowniki wprowadzają specjalistyczne terminy do silnika transkrypcji jako wskazówkę przed rozpoczęciem przetwarzania. Znacznie poprawia to rozpoznawanie norweskich terminów prawnych, nazw własnych i skrótów.',
|
||||
'step3_table_preset' => 'Słownik',
|
||||
'step3_table_contains' => 'Zawiera',
|
||||
'step3_table_use' => 'Kiedy używać',
|
||||
'step3_barnerett' => 'Ochrona dzieci / BV',
|
||||
'step3_barnerett_contains' => 'Barnevernet, omsorgsovertakelse, fylkesnemnda, sakkyndig, foreldreansvar, samvær, tilsynsfører…',
|
||||
'step3_barnerett_use' => 'Sprawy ochrony dzieci, przesłuchania dotyczące opieki, postępowania rady okręgu.',
|
||||
'step3_mediation' => 'Mediacja / spotkanie prawne',
|
||||
'step3_mediation_contains' => 'Mekling, mekler, avtale, forlik, tingrett, advokat, saksøker, saksøkt…',
|
||||
'step3_mediation_use' => 'Mediacja sądowa, negocjacje z prawa rodzinnego.',
|
||||
'step3_generell' => 'Ogólny norweski',
|
||||
'step3_generell_contains' => 'Powszechne norweskie słownictwo prawne i administracyjne, nazwy agencji rządowych.',
|
||||
'step3_generell_use' => 'Korespondencja NAV, ogólne przesłuchania administracyjne.',
|
||||
'step3_custom' => 'Własny',
|
||||
'step3_custom_contains' => 'To, co wpiszesz w polu tekstowym poniżej (maks. 500 znaków).',
|
||||
'step3_custom_use' => 'Unikalne nazwy spraw, specjalistyczne terminy medyczne, nazwy organizacji.',
|
||||
'step3_custom_tip' => 'Używając Własnego słownika, wypisz terminy oddzielone przecinkami lub nowym wierszem. Uwzględnij własne nazwy, niezwykłe nazwy miejsc i terminologię techniczną. Przykład: «Kristoffersen, barnevernstjenesten i Stavanger, ADHD, omsorgsovertakelse».',
|
||||
'step4_title' => '4. Zadanie: Transkrypcja vs Tłumaczenie',
|
||||
'step4_intro' => 'Dostępne w Opcjach zaawansowanych.',
|
||||
'step4_transcribe' => 'Transkrypcja (domyślna): wynik w tym samym języku co nagranie.',
|
||||
'step4_translate' => 'Przetłumacz na angielski: wynik jako angielskie tłumaczenie mówionej treści. Język źródłowy jest wykrywany automatycznie (lub użyj ustawienia Język nagrania). Przydatne przy udostępnianiu norweskiego lub ukraińskiego nagrania osobom niebędącym native speakerami norweskiego.',
|
||||
'step4_note' => 'Tłumaczenie jest obsługiwane przez model Whisper i daje przyzwoite, ale niepoświadczone sądownie tłumaczenie. Do formalnych przedłożeń prawnych używaj certyfikowanego tłumacza przysięgłego.',
|
||||
'step5_title' => '5. Filtr VAD',
|
||||
'step5_intro' => 'Filtr VAD (Wykrywanie aktywności głosowej) usuwa ciszę i segmenty bez mowy przed transkrypcją. Dostępny w Opcjach zaawansowanych.',
|
||||
'step5_when_on' => 'Włącz gdy: nagranie ma długie przerwy, szum tła lub pochodzi z rozmowy telefonicznej z muzyką oczekiwania.',
|
||||
'step5_when_off' => 'Pozostaw wyłączony gdy: nagranie to czyste audio studyjne lub plik wideo, gdzie cisza ma znaczenie (np. zaplanowane przerwy podczas przesłuchania policyjnego).',
|
||||
'step5_tip' => 'Jeśli otrzymujesz krótkie, urwane transkrypcje z brakującą treścią, filtr VAD może odcinać prawdziwe wypowiedzi. Wyłącz go.',
|
||||
'step6_title' => '6. Model Whisper',
|
||||
'step6_intro' => 'Dostępny w Opcjach zaawansowanych. Whisper jest używany gdy Azure Speech i Google Cloud są niedostępne. Wybór modelu to kompromis między dokładnością a szybkością.',
|
||||
'step6_table_model' => 'Model',
|
||||
'step6_table_speed' => 'Szybkość',
|
||||
'step6_table_accuracy' => 'Dokładność',
|
||||
'step6_table_use' => 'Kiedy używać',
|
||||
'step6_lv3' => 'large-v3',
|
||||
'step6_lv3_speed' => 'Najwolniejszy',
|
||||
'step6_lv3_accuracy' => 'Najlepsza',
|
||||
'step6_lv3_use' => 'Domyślny. Dla każdego ważnego nagrania.',
|
||||
'step6_lv2' => 'large-v2',
|
||||
'step6_lv2_speed' => 'Wolny',
|
||||
'step6_lv2_accuracy' => 'Doskonała',
|
||||
'step6_lv2_use' => 'Nieco szybszy od v3 przy porównywalnej dokładności.',
|
||||
'step6_medium' => 'medium',
|
||||
'step6_medium_speed' => 'Umiarkowana',
|
||||
'step6_medium_accuracy' => 'Dobra',
|
||||
'step6_medium_use' => 'Dłuższe nagrania gdy liczy się szybkość.',
|
||||
'step6_small' => 'small',
|
||||
'step6_small_speed' => 'Szybki',
|
||||
'step6_small_accuracy' => 'Dostateczna',
|
||||
'step6_small_use' => 'Szybkie przybliżone transkrypcje. Niezalecany do użytku prawnego.',
|
||||
'step6_base' => 'base',
|
||||
'step6_base_speed' => 'Bardzo szybki',
|
||||
'step6_base_accuracy' => 'Słaba',
|
||||
'step6_base_use' => 'Tylko do testów.',
|
||||
'step6_tiny' => 'tiny',
|
||||
'step6_tiny_speed' => 'Najszybszy',
|
||||
'step6_tiny_accuracy' => 'Bardzo słaba',
|
||||
'step6_tiny_use' => 'Tylko do testów. Niezalecany.',
|
||||
'step6_note' => 'W praktyce Azure Speech i Google Cloud są testowane jako pierwsze i obie doskonale sprawdzają się w języku norweskim. Whisper jest rezerwą — rzadko trzeba zmieniać to ustawienie.',
|
||||
'step7_title' => '7. Czyszczenie AI',
|
||||
'step7_intro' => 'Dostępne w Opcjach zaawansowanych. Po wygenerowaniu transkrypcji opcjonalne przejście AI poprawia błędy rozpoznawania, normalizuje interpunkcję i poprawia terminologię.',
|
||||
'step7_none' => 'Brak (domyślne): surowy wynik z silnika. Najszybszy, najtańszy.',
|
||||
'step7_mini' => 'GPT-4o Mini: szybkie przejście czyszczenia. Naprawia oczywiste błędy, poprawia interpunkcję, koryguje częste błędne rozpoznania. Dodaje 1 kredyt.',
|
||||
'step7_full' => 'GPT-4o: głębokie przejście czyszczenia. Lepiej obsługuje terminologię dziedzinową, niejednoznaczne nazwy i złożone struktury zdań. Dodaje 2 kredyty.',
|
||||
'step7_tip' => 'Dla większości spraw czyszczenie GPT-4o Mini to najlepsza wartość. Uruchom GPT-4o gdy nagranie jest zaszumione lub treść zawiera niezwykłą terminologię.',
|
||||
'step8_title' => '8. Przesyłanie nagrania',
|
||||
'step8_intro' => 'Przeciągnij i upuść jeden lub więcej plików do strefy przesyłania lub kliknij Przeglądaj, aby je wybrać.',
|
||||
'step8_formats' => 'Obsługiwane formaty: MP3, WAV, OGG, M4A, FLAC, WEBM.',
|
||||
'step8_size' => 'Maksymalny rozmiar pliku: 200 MB na plik.',
|
||||
'step8_queue' => 'Wiele plików: dodaj kilka plików do kolejki. Są transkrybowane kolejno, a wyniki są łączone.',
|
||||
'step8_tip' => 'Jeśli masz długie przesłuchanie podzielone na kilka nagrań, dodaj wszystkie części do kolejki. Wynik będzie zawierał wszystkie części w odpowiedniej kolejności.',
|
||||
'step9_title' => '9. Biblioteka Moje nagrania',
|
||||
'step9_intro' => 'Kliknij «Wybierz z Moich nagrań», aby otworzyć nagrania, które wcześniej przesłałeś i zapisałeś na swoim koncie. Przechowywane nagrania wliczają się do Twojego limitu miejsca.',
|
||||
'step9_save' => 'Aby zapisać plik audio w Moje nagrania do późniejszego użycia, prześlij go i zaznacz opcję «Zapisz w Moje nagrania» w panelu wyników.',
|
||||
'step10_title' => '10. Odczytywanie wyników',
|
||||
'step10_intro' => 'Każda linia transkrypcji ma następujący format:',
|
||||
'step10_format' => '[GG:MM:SS] MÓWCA N: Transkrybowany tekst tutaj.',
|
||||
'step10_timestamp' => 'Znacznik czasu określa, kiedy segment zaczyna się w nagraniu.',
|
||||
'step10_speaker' => 'MÓWCA N to przypisana etykieta mówcy. Gdy diaryzacja jest wyłączona, wszystkie linie są wyświetlane bez etykiety mówcy.',
|
||||
'step10_confidence' => 'Przejście czyszczenia AI może dodawać znaczniki [niejasne] tam, gdzie mowa była niezrozumiała.',
|
||||
'step10_tip' => 'Używaj znaczników czasu do weryfikacji krzyżowej transkrypcji z oryginalnym nagraniem. Jeśli linia wydaje się błędna, odtwórz odpowiednią sekcję nagrania.',
|
||||
'step11_title' => '11. Zapisywanie i eksport',
|
||||
'step11_intro' => 'Po pojawieniu się transkrypcji masz trzy opcje:',
|
||||
'step11_minsak' => 'Zapisz do Min Sak: zapisuje transkrypcję do bieżącego pliku sprawy. Stamtąd jest dostępna w Osi czasu, Redakcji, Korespondencji i innych narzędziach jako dokument źródłowy.',
|
||||
'step11_corpus' => 'Zapisz do korpusu: zapisuje transkrypcję do przeszukiwalnego korpusu do użytku między sesjami.',
|
||||
'step11_download' => 'Pobierz: zapisuje transkrypcję jako plik tekstowy na Twoim komputerze.',
|
||||
'step11_copy' => 'Skopiuj: kopiuje całą transkrypcję do schowka.',
|
||||
'step11_note' => 'Audio jest przetwarzane w pamięci i nie jest przechowywane na serwerze. Nic nie jest zachowywane, chyba że zdecydujesz się zapisać transkrypcję.',
|
||||
),
|
||||
);
|
||||
Reference in New Issue
Block a user