Treterezh emgefre al lavar
Un danvez pennad eo ar pennad-mañ ha labour zo d'ober c'hoazh a-raok e beurechuiñ.
Gallout a rit skoazellañ Wikipedia dre glokaat anezhañ.
Treterezh emgefre al lavar a zo ur skourr etrediskiblezh eus an urzhiataerezh hag eus ar c'hlaskerezh roadoù. E bal pennañ eo klask degas d'an urzhiataerioù barregezhioù evit tretiñ hag embregañ lavar an den. Gantañ e c'heller ober war-dro restroù roadennoù, korpusoù testennoù pe korpusoù komzoù, evit sevel un deskoni ardivinkel fardet diwar hentennoù a c'hell bezañ reolluniet pe tebegourel. Reiñ d'un urzhiataer ar ouestoni da dizhout ur seurt komprenezon eus an endalc'hioù, eus an arlivioù kemperzhel staget outo, eo an disoc'h da gaout. Pennaennoù hag a zeu eus ar yezhoniezh a vez implijet evit diboullañ ar stlenn arveradus, asambles gant ar pezh a c'hell degas spiswel ha perzhegezh, koulz ha rummata hag aozañ an unpezhioù stlenn o-unan. Gant naouerezh ar gomz, komprenezon al lavar naturel ha krouidigezh al lavar naturel e ya diazezoù treterezh al lavar.
Iskevrennad eus | naouegezh artifisiel, stlenneg, stlennyezhouriezh, diskiblezh akademek, information processing |
---|---|
Hashtag | NLProc |
Pleustret gant | natural language processing engineer |
Tikedenn Stack Exchange | https://stackoverflow.com/tags/nlp, https://ai.stackexchange.com/tags/natural-language-processing |
Istor
kemmañEr bloavezhioù 1950 e krog ar studi efedus eus treterezh al lavar gant ardivinkoù, ar re savet evit an urzhiataerezh o tiwan, da gentañ-holl. Sellet a reer ouzh ar studiadenn embannet gant Alan Turing, Computing machinery and intelligence (e brezhoneg : "Ardivinkoù urzhiataerezh ha naouegezh")[1], evel an destenn damkaniel diazez. En e bennad e kinnige un doare da briziañ kalite an naouegezh ardivinkel a voe graet Prouad Turing anezhañ diwezhatoc'h. Muzuliañ a ra ar prouad live speredegezh un ardivink diouzh barregezh ur programm divizoù da dremen evit un den : e-kerzh un eskemm kemennadennoù skrivet eo ret d'un den divinout hag-eñ emañ o kenskrivañ gant un ardivink pe gant un den all. Meno un implijer hepken avat a zepant diouzh re a faktorioù stag ouzh e endro evit bezañ gwelet evel ur reolenn[2].
E 1954 e voe kaset "arnod Georgetown" da benn gant Skol-veur Georgetown, e Washington, gant sikour IBM. Klask a raed treiñ e saozneg en un doare emgefreek penn-da-benn en tu all da dri-ugent frazenn rusianek romanekaet a denne da dachennoù evel ar politikerezh, ar gwir, ar matematik pe ar skiant. Lavarout a rae aozerien an taol-arnod e vefe posubl sevel an treiñ emgefre dindan tri pe pemp bloavezh.
Splann eo avat e oa bet choazet ar frazennoù rusianek gant aked hag e oa bet prientet an niver a oberatadennoù sevenet evit an anatadur evit gerioù ha frazennoù resis. Ouzhpenn, ne oa ket a zielfennadur eus an darempredoù pe eus an ereadurezh da anavezout framm ar frazennoù. Diazezet e oa an hentenn implijet war ur geriadur ma oa liammet ar gerioù ouzh reolennoù ha doareoù-ober resis[3].
Kalz gorrekoc'h ha dipitus e voe an araokadennoù avat. Hervez ur studiadenn eus ar Stadoù-Unanet, danevell an ALPAC savet e 1966[4], ne oa ket bet tizhet ar palioù gortozet goude dek bloavezh imbourc'h. Pa en em rentas kont an enklaskerien eus kemplezhded vras ar yezhoù e teuas palioù al labourioù enklask da vezañ kalz uveloc'h.
A-drugarez d'ar penndiazezoù degaset gant Turing e teuas Joseph Weizenbaum a-benn da sevel, etre 1964 ha 1966, ar c'hentañ aotomat divizer gouest da douellañ un den ha da dremen evit un den all[5]. An aotomat, ELIZA e anv, a oa sañset tremen evit ur psikoterapour, a zeue a-benn a-wezhioù da skoulmañ eskemmoù damheñvel ouzh an eskemmoù etre an dud, ken ez eo souezhus, daoust ma ne rae gant hogos titour ebet diwar-benn preder pe fromoù mab-den. Da skouer, pa'z ae ar « c'hlañvour » en tu all da varregezhioù izel ar bank anaoudegezhioù, e c'halle ELIZA reiñ ur respont jenerek, evel « Perak e lavarit ho peus poan-benn ? » evit respont da « Poan-benn am eus ».
E diwezh ar bloavezhioù 1960, Terry Winograd, ur c'hlasker eus an MIT, a savas ur programm e lavar naturel a oa SHRDLU e anv (distagañ « chreudeul »). A-drugarez dezhañ e c'halle an implijer divizout gant un urzhiataer da verañ ur « bed kuboù » (a blocks world) a c'halled gwelet war unan eus ar skrammoù kentañ. Ar c'hentañ programm e oa a-gement a ouie kompren ha seveniñ urzhioù kemplezh roet e lavar naturel. Tout ar pezh a c'halle ober avat a oa kemer kuboù, cheñch lec'h dezhe, o bodañ pe o divodañ. Ne c'hallas morse kompren kement a c'hall an dud ober gant traezoù fizikel[6].
E-pad ar bloavezhioù 1970, kalz programmourien a oa kroget da skrivañ « ontologiezhioù meizadel », a oa o fal urzhiañ an titouroù e roadoù a c'halle bezañ komprenet gant un urzhiataer. En o zouez e oa MARGIE (Schank, 1975), SAM (Cullingford, 1978), PAM (Wilensky, 1978), TaleSpin (Meehan, 1976), SCRUPULE (Lehnert, 1977), Politics (Carbonell, 1979), ha Plot Units (Lehnert, 1981).
E miz Genver 2018, patromoù naouegezh diorroet gant Microsoft hag Alibaba a zeuas a-benn, pep hini diouzh e du, d'ober gwelloc'h evit an dud e prouadoù lenn ha kompren eus skol-veur Stanford. Drevezet e oa doare an dud da gompren ar gerioù hag ar frazennoù gant treterezh emgefreek al lavar naturel hag a-drugarez dezhañ e c'halle hiviziken ar patromoù deskoni emgefreek ober gant kementadoù bras a ditouroù a-raok reiñ respontoù resis d'ar goulennoù a saved gante[7].
E miz Du 2018, Google a roas lañs da BERT, ur patrom lavar[8].
E miz Mae 2020, OpenAI, un embregerezh savet gant Elon Musk ha Sam Altman, a roe lañs da GPT-3, ur patrom lavar dezhañ 175 miliard arventennoù skignet evel fork un API kenwerzh[9].
Damkanioù
kemmañHentennoù
kemmañLevrlennadur
kemmañLiammoù diavaez
kemmañPennadoù kar
kemmañNotennoù ha daveennoù
kemmañ- ↑ Alan Turing, « Computing machinery and intelligence », e-barzh Mind, Oxford University Press, levrenn 59, Nnn 236, miz Here 1950
- ↑ Pennad « Critère de Turing », Dictionnaire de l'Informatique et de l'Internet 2001, Micro Application, 2000, p. 232 : « Des programmes avec dialogue en langage naturel ont été conçus pour répondre à ce critère ».
- ↑ (en) Erwin Reifler, "The solution of MT linguistic problems through lexicography", in Proceedings of the National Symposium on Machine Translation, Machine Translation, 12, miz C'hwevrer, 1960, pp. 195-252.
- ↑ Villard Masako (dir.), « Traduction automatique et recherche cognitive », Histoire Épistémologie Langage (Sciences du langage et recherches cognitives), levrenn 11, Nnn 1, 1989, p. 55-84 (DOI 10.3406/hel.1989.2290, www.persee.fr/doc/hel_0750-8069_1989_num_11_1_2290)
- ↑ Marc-Emmanuel Perrin, "Les machines progressent dans leur apprentissage du langage naturel" Diell, Mission pour la Science et la Technologie de l'Ambassade de France aux Etats-Unis, 22 septembre 2017.
- ↑ Serge Boisse, "Etaoin Shrdlu" Diell, e Journal d'un terrien, hep deiziad.
- ↑ « Alibaba's AI Outguns Humans in Reading Test », Bloomberg.com, 15 a viz Genver 2018 (Diell, lennet d'ar 16 a viz Genver 2018).
- ↑ Toutanova, Kristina, « BERT : Pre-training of Deep Bidirectional Transformers for Language Understanding » Diell, war arXiv.org, 11 a viz Here 2018 (lennet d'an 31 a viz Gouere 2020).
- ↑ (en) Will Douglas Heaven, « OpenAI’s new language generator GPT-3 is shockingly good—and completely mindless », MIT Technology Review, 20 a viz Gouere 2020 (Diell).