Google umí lépe překládat do češtiny. Přibližuje se mluvené řeči

20. 4. 2017

Loni na podzim Google oznámil největší změnu ve svém překladači za posledních deset let. Do té doby používal standardní statistický frázový model, který hledal mezi dvěma spárovými slovníky stejná slova nebo slovní spojení. Dokázal tak přeložit všechna slova ve větě, díky zapojení sady pravidel použil i správné skloňování/časování nebo jiné perličky daného jazyka, ale výsledek nemusel dávat smysl.

Pak do překladů zapojil neuronovou síť, která se učí chápat smysl napsaného textu. Překlad už netvoří na základě frází, ale celých vět. Z počátku zapojil neuronové sítě jen do hlavních světových jazyků, teď je přidává i do češtiny nebo slovenštiny. Přirozenější a smysluplnější věty budou zatím dostupné jen mezi češtinou a angličtinou. Mezi češtinou a například němčinou se použije původní frázový model.

„Zjistili jsme, že neuronová technologie zpracovává jazyky lépe, když se jich učí několik najednou. Stejně jako se člověk snadněji naučí novou cizí řeč, pokud už zná příbuzné jazyky. Máme například víc dat pro hindštinu než pro maráthštinu a bengálštinu a zjistili jsme, že když se je systém učí všechny současně, zkvalitní se všechny překlady o mnoho víc, než kdyby se je systém učil každý zvlášť,“ říká Google.

Novinka je dostupná ve webovém Překladači, vyhledávači a aplikacích pro Android (Play Store) a iOS (App Store). Brzy bude fungovat i v integrovaném překladači stránek v prohlížeči Chrome.

Co je na tomto systému překladu nového?

(Oficiální text Googlu bez redakčních úprav.)

Neuronový i statistický systém strojového překladu vycházejí z obrovského množství oficiálních překladů stejných dokumentů do vícero jazyků. Z nich systémy určují, jaký je mezi těmito jazyky vztah. Rozdíl je v tom, jak každý z těchto systémů tato data využívá. Neuronový překlad se neučí jazyky jako takové, ale sám se učí, jak překládat zadané texty, tak aby co nejvíce odpovídaly textům, které jsme mu poskytli k učení. Zatímco statistický systém porovnává vložená data podle předem zadaných gramatických vzorců.

Podrobněji: Jedním ze způsobů, kterým se model „sám“ učí, je určování míry podobnosti jednotlivých slov a frází. Díky tomu neuronový překlad lépe pracuje s mnohoznačnými i řídce užívanými slovy. Dokáže totiž odhadnout jejich použití podle známých slov stejného druhu.

Například, slovo „tuřín“ se v běžné mluvě příliš nevyskytuje, ale neuronový systém na základě dat odhadne, že s ním ve větě může pracovat podobně jako se slovy „mrkev“ nebo „brambora“. K podobným závěrům je schopen dojít i na základě vstupů z různých jazyků, které se učí současně – když budeme mít více ukázkových vět o bramborách v holandštině než v islandštině, odhadne systém na základě znalostí z holandštiny, jak mluvit o bramborách islandsky.

Vstoupit do diskuse

Sdílet

Co je na tomto systému překladu nového?

Autor článku

Lukáš Václavík

Témata:

Anketa

Má podle vás Mironet právo na odškodné?

Kvíz týdne

Corsair má 12+4pinový kabel, který zabrání roztavení konektorů GPU a funguje s jakýmkoli zdrojem

Toto je 5 kreativních způsobů, jak využít NFC v telefonu i jinak než k placení

Logitech má nový high-end mezi klávesnicemi s kombinací analogových a mechanických spínačů. High-endová je i cena

Čínsko-ruský procesor zklamal v herním testu. Zaklínače 3 si na něm stěží zahrajete na 30 FPS

Nvidia zvětšuje paměť grafik, ale jenom v noteboocích: Uvádí mobilní GeForce RTX 5070 12GB

Intel se nečekaně zotavil: Díky AI v Q1 2026 prodal i skladové ležáky a vadné čipy, akcie jsou na absolutním rekordu

Na iPhony a iPady je možné instalovat nový XChat. Stojí za ním Elon Musk

Steam Controller se dostane do obchodů za týden: cena je vysoká, má ale unikátní funkce

Předprodej toolchangeru INDX pro Prusa Core One zahájen. Cena bohužel nepříjemně překvapí

Toyota proměnila luxusní autosedačku v herní židli: má pás s USB-C, vyhřívání i chlazení

Google umí lépe překládat do češtiny. Přibližuje se mluvené řeči

Sdílet

Co je na tomto systému překladu nového?

Autor článku

Lukáš Václavík

Témata:

Anketa

Má podle vás Mironet právo na odškodné?

Kvíz týdne

Nejnovější články

Corsair má 12+4pinový kabel, který zabrání roztavení konektorů GPU a funguje s jakýmkoli zdrojem

Toto je 5 kreativních způsobů, jak využít NFC v telefonu i jinak než k placení

Logitech má nový high-end mezi klávesnicemi s kombinací analogových a mechanických spínačů. High-endová je i cena

Čínsko-ruský procesor zklamal v herním testu. Zaklínače 3 si na něm stěží zahrajete na 30 FPS

Nvidia zvětšuje paměť grafik, ale jenom v noteboocích: Uvádí mobilní GeForce RTX 5070 12GB

Intel se nečekaně zotavil: Díky AI v Q1 2026 prodal i skladové ležáky a vadné čipy, akcie jsou na absolutním rekordu

Na iPhony a iPady je možné instalovat nový XChat. Stojí za ním Elon Musk

Steam Controller se dostane do obchodů za týden: cena je vysoká, má ale unikátní funkce

Předprodej toolchangeru INDX pro Prusa Core One zahájen. Cena bohužel nepříjemně překvapí

Toyota proměnila luxusní autosedačku v herní židli: má pás s USB-C, vyhřívání i chlazení

Dále u nás najdete

OnlyOffice k Euro-Office: musíte použít naše loga, ale nesmíte

Ukládání dat na území EU láká. Víc než půlka českých firem by si za to i připlatila, tvrdí průzkum

CorelDRAW Graphics Suite 2026: design s Artist Intelligence

Jak dostat z bytu problémové nájemníky snadno a rychle

Chytila pájku za pálivý konec, dnes tvoří unikáty z cínu i skla

Generace Z se brání umělé inteligenci v práci

CreditShare míří na drobné investory, úvěry vybírá přísně

Kombinace některých doplňků nadělá víc škody než užitku

Perličky z diskuze účetních k JMHZ

Otestovali jsme za vás novou vlakovou linku z Prahy do Varšavy

Jste nemocní a každý na vás kouká, říká pacientka s rakovinou

Lidé cupují kulturu pro všechny a bojí se o kvalitu muzeí

Konec plošného skenování konverzací?

JMHZ v praxi: Jak správně využít služby a vyhnout se chybám

Google bude tvrdě postupovat proti zneužívání tlačítka Zpět

Lidé už si nechtějí kupovat bezpečnost na míru

EU si posvítila na AI, chce speciální označení pro obsah

Hrozba, nebo příležitost? Umělá inteligence proměňuje webdesign

Soud: Mironet má nárok na ušlý zisk po zpackané razii

Stát hodil školy přes palubu. Ty teď řeší, kde vzít na povinné plavání