Naukowcy z UCLA, MIT i National Institutes of Health opublikowali na łamach Nature Human Behaviours wyniki badań udowadniające, że system AI potrafi nauczyć się znaczeń słów wyłącznie na podstawie nauki ich asocjacji i występowania w tekście.
Czytaj też: Język Aborygenów środkiem komunikacji ze sztuczną inteligencją. Chodzi o jego osobliwą składnię
Badacze „przepuścili” przez system niewyobrażalną ilość tekstu z internetu, który zawierał dziesiątki miliardów słów. Materiał internetowy pochodził z ostatniej dekady. AI rozpoznawało m.in. połączenia słów – np. jeśli zlepek słów „stół” i „krzesło” występowało częściej niż „stół” i „planeta”, wówczas to pierwsze uznawał za słowa bliższe znaczeniowo. Następnie przeprowadzono serie testów, aby stwierdzić, jak sztuczna inteligencja rozumie słowa.
Zastosowano technikę tzw. projekcji semantycznej. Na wykresie zostały posortowane słowa (rzeczowniki) w zależności od ich relacji do dwóch głównych o przeciwnym znaczeniu słów nadających cechę (przymiotników), np. duży-mały, bezpieczny-niebezpieczny i inne wyrazy określające inteligencję, wiek, płeć itd. Na warsztat była wzięta grupa 52 wyrazów, które w jasny i klarowny sposób można posortować.
W jaki sposób sztuczna inteligencja posortowała słowa na podstawie przeczytanych zasobów internetowych?
W kategorii zwierząt poradziła sobie doskonale – mysz, chomika czy komara zakwalifikowała jako „małe”, a wieloryba, orkę i łosia jako „duże”. W przypadku imion anglojęzycznych Betty i George są do siebie podobne, ponieważ częściej odnoszą się do osób starszych, ale są przeciwne dlatego, że noszą je osoby przeciwnej płci.
Ciekawa sprawa miała się w przypadku podnoszenia ciężarów i szermierki – obydwa słowa zakwalifikowano do podobnych, ponieważ odnoszą się do dziedzin sportu uprawianych wewnątrz, ale… (co zapewne nie wszystkim się spodoba) pod względem wymaganej inteligencji zostały postawione na dwóch różnych biegunach.
Analogiczne badanie przeprowadzano na grupie 25 osób, które poproszono w takie samo dopasowywanie słów. Rezultaty były niemal identyczne z tymi, które pokazało AI.
Czytaj też: Szympansy mają bardziej złożony język, niż nam się wydawało
Badacze są zaskoczeni, że system uczenia maszynowego zadziałał tak skutecznie. Ich zdaniem to udowadnia, że komputery mogą rozumieć nawet bardziej skomplikowane frazy tak samo jak człowiek. Ponadto o samej naturze języka można się wiele dowiedzieć – nie zawsze uczymy się rozumienia słów poprzez zapamiętywanie znaczeń, ale przez całe asocjacje fraz.