Algorytm MUM. Co wiemy? Czy mamy się czym martwić?

Michał Szylko
Algorytm MUM. Co wiemy? Czy mamy się czym martwić?

Panda, Koliber, a teraz MUM – trzeba przyznać, że mości panujący nam Google ma… pomysłowe „imiona” dla swoich algorytmów. A przy okazji zapowiedzi każdego kolejnego wiele osób pracujących „w Internecie” patrzy z trwogą w przyszłość, ale czy słusznie? Co wiemy, a czego jeszcze musimy się dowiedzieć o algorytmie MUM?

Najpierw parę słów o historii, czyli o BERT

BERT, przy czym nie chodzi o popularną postać z „Muppet Show”, to niejako przodek bohatera dzisiejszego tekstu. Ta zaprezentowana w 2019 roku aktualizacja algorytmów wyszukiwania, opiera się na NLP. Zaraz, zaraz… Czym jest NLP? NLP to skrótowiec (Amerykanie kochają skrótowce)
od natural language processing, czyli przetwarzania języka naturalnego. Samo NLP jest szerokim pojęciem, lecz w tym kontekście często występuje wraz z BERT-em, którego celem, ujmując to ogólnie, jest lepsze rozumienie naturalnego języka użytkowników. Zdaniem Google, w momencie wdrażania BERT-a, miał on wpłynąć na około 10% wyników wyszukiwania. Przed wprowadzeniem tych zmian Google podchodził do fraz kluczowych jako zbioru słów, teraz nie tylko rozumie wyrazy w zapytaniu, lecz również ich kontekst i kolejność. Co również ważne, zmiany są widoczne nie tylko w wynikach wyszukiwania, lecz i featured snippets. Dodatkowo wcześniej pomijane „stopwords” jak „to” i „go” zyskały na znaczeniu.

No dobrze, dobrze, ale CO KONKRETNIE TO ZMIENIŁO?

Źródło: https://blog.google/products/search/search-language-understanding-bert/

Zgodnie z wpisem na blogu Google:

„Oto wyszukanie: «2019 brazil traveler to usa need a visa». Słowo «to»
i jego związek z innymi słowami w zapytaniu są szczególnie ważne dla zrozumienia znaczenia. Chodzi o Brazylijczyka podróżującego do USA, a nie na odwrót. Wcześniej nasze algorytmy nie rozumiały znaczenia tego połączenia i zwracaliśmy wyniki dotyczące obywateli USA podróżujących do Brazylii. Dzięki BERT wyszukiwarka jest w stanie uchwycić ten niuans i wiedzieć, że bardzo powszechne słowo
«to» ma tutaj duże znaczenie, a my możemy dostarczyć znacznie trafniejsze wyniki dla tego zapytania” (tłum. własne).

Algorytm BERT pozwolił, głównie dzięki NLP, na lepsze dopasowanie wyników wyszukiwania i featured snippets do zapytania, które wpisujemy w wyszukiwarkę. Dzięki temu wyszukiwanie będzie jak najbardziej przydatne nam, czyli użytkownikom. No dobrze, ale czemu właściwie mówimy o aktualizacji, która miała miejsce już ładnych parę lat temu – co, jak wiemy, w świecie SEO czy Internetu jest prehistorią? Głównie dlatego, że BERT i NLP są ściśle skorelowane z MUM. A dokładniej mówiąc, MUM nie istniałoby, gdyby nie BERT.

BERT 2.0 czy jednak coś innego?

MUM, czyli z angielskiego „Multitask Unified Model”, jest rozszerzeniem BERT-a, jednak w taki sam sposób jak najnowszy VW Passat jest rozszerzeniem modelu T Forda. Oba to samochody, ale więcej je różni niż łączy. Owszem, MUM w telegraficznym skrócie również jest nastawiony na to, aby pomagać użytkownikom, lecz robi to (czy też bardziej ma robić) na znacznie wyższym levelu.

Google przywołuje nam taki obrazek:

Właśnie wszedłeś na górę Adams (chciałbym!), jesienią przyszłego roku chcesz wyruszyć na górę Fuji i chcesz wiedzieć, co zrobić inaczej, aby się przygotować. Dziś Google mógłby Ci w tym pomóc, ale wymagałoby to wielu przemyślanych wyszukiwań – musiałbyś szukać wysokości każdej góry, średniej temperatury jesienią, trudności szlaków turystycznych, odpowiedniego sprzętu do użycia i wielu innych. Po wielu poszukiwaniach w końcu będziesz w stanie uzyskać odpowiedź, której potrzebujesz. A co gdybyś porozmawiał z ekspertem od takich spraw?

I’ve hiked Mt. Adams and now want
to hike Mt. Fuji next fall, what should
I do differently to prepare?

I, co ważne, zadał mu tylko jedno pytanie: „Co powinienem zrobić inaczej, aby się przygotować?”. Z pewnością otrzymałbyś przemyślaną i złożoną odpowiedź, która uwzględni różne niuanse Twojego zadania itd.

Nie tyczy się to tylko tak „ekstremalnych” pytań. W rzeczywistości zdaniem Google „okazuje się, że ludzie wpisują średnio osiem zapytań dla złożonych zadań, takich jak to” (tłum. własne + źródło podlinkowane).

Co ważne, dzisiejsze algorytmy Google są „wystarczająco mądre”, by odpowiedzieć na pytanie jak ekspert. Problemem tutaj nie są dane, lecz sam sposób ich prezentacji i ilość zapytań, jaką trzeba wpisać, aby uzyskać odpowiedni, pożądany efekt.

Ciekawostka

od 16% do 20% wszystkich wyszukań w Google jest wpisywanych po raz pierwszy.

Kilka technicznych aspektów

  • MUM opiera się na T5 (Text-To-Text Transfer Transformer), a tych, którzy chcieliby przeczytać o tym więcej, zapraszam tutaj; dla nas wystarczy,
    że T5 ma za zadanie przerobić wszelkie zapytania NLP w zunifikowany format text–text, gdzie wejście/wyjście są zawsze łańcuchami tekstowymi (BERT tego nie potrafił).

Źródło: https://1.bp.blogspot.com/-o4oiOExxq1s/Xk26XPC3haI/AAAAAAAAFU8/NBlvOWB84L0PTYy9TzZBaLf6fwPGJTR0QCLcBGAsYHQ/s1600/image3.gif

  • MUM ma być 1000 razy bardziej potężny od BERT-a.
  • MUM nie tylko rozumie języki, lecz też jest w stanie coś w nich „stworzyć”. Dane, których używa, zostały oparte na 75 różnych językach i wielu różnych zadaniach
  • MUM jest też multimodalny, co oznacza, że jest w stanie wygenerować informacje nie tylko na bazie tekstu i grafiki, lecz w przyszłości również wideo czy audio.

W telegraficznym skrócie ‒ MUM jeszcze bardziej wykorzystuje sztuczną inteligencję niż BERT, a do tego będzie w stanie odpowiedzieć na bardziej „pogłębione” zapytania (jak przykład z górą Fuji) w sposób mniej złożony. Bez konieczności wielokrotnych wyszukań, sprawdzania informacji, porównywania i ich weryfikowania – tak jak robimy to teraz sami jako użytkownicy. Oprócz tego MUM ma być w stanie pokonać bariery geograficzne i językowe poprzez prezentowanie danych z różnych języków, a także innych niż tekst źródeł.

Brzmi niczym przyszłość z „Cyberpunk 2077”?

Trochę taka jest, chociaż została zapowiedziana już w roku 2021, to z pewnością większe zmiany związane z tym algorytmem czekają na nas
w przyszłości.

Co ważne, każda zmiana w wyszukiwarce Google wprowadzana jest odpowiedzialnie. W kontekście MUM Google planuje przede wszystkim zminimalizować ryzyko pojawienia się wszelkich uprzedzeń, które związane są z maszynowym uczeniem się. W tym celu zastosuje:

  • Szczegółową analizę informacji zwrotnych, które otrzyma od osób zajmujących się oceną i weryfikacją wyszukiwań;
  • Podobnie jak w przypadku aktualizacji BERT w 2019 roku, również MUM zostanie poddany temu samemu procesowi, który zastosowano
    w modelach wyszukiwania Google;
  • Do istotnych zmian należy także wykorzystanie najnowszych badań dotyczących emisji dwutlenku węgla – efektywnie funkcjonujące wyszukiwarki wiążą się ze znacznie mniejszym śladem węglowym.

Uff, dobrnęliśmy do końca technicznych i około technicznych rzeczy. Pytanie pozostaje jednak wciąż jedno: jak będzie wyglądać SEO w przyszłości? (przy okazji jest to idealny przykład złożonego pytania pod MUM).

SEO a MUM – co wiemy? Czego się możemy spodziewać?jednak coś innego?

Od samego początku algorytmy zmieniły sposób, w jaki SEO czy ogólnie content marketing tworzą treści i w jaki sposób są nam one serwowane. Coraz bardziej zmierzamy do treści, które są bardziej przyjazne dla użytkownika i też w tym kierunku ma działać MUM. W tym sensie jest to zdecydowanie ewolucja, a nie rewolucja. MUM jeszcze bardziej postawi na treść, która ma być lepiej dopasowana do użytkownika, a dostępność strony, jej budowa czy wreszcie aspekty UX i SEO staną się jeszcze ważniejsze. W niebyt mogą odejść teksty pisane pod sztywne wytyczne, typu: frazy „zielona sukienka” proszę użyć 4 razy na 800 zzs itp. Podobnie ważne okazują się formaty jak zdjęcia czy filmy wideo, które teraz są „tylko” ozdobnikami, a przy MUM będą stanowiły integralny element strony. Końcowi użytkownicy, nasi klienci, są teraz jeszcze ważniejsi.

MUM w praktyce

Pewne zmiany już się dzieją i tylko kwestią przyszłości jest to, że będą one obecne na co dzień „w serpach”.

Google wprowadza funkcjonalności widoczne w wynikach wyszukiwania. A ściślej są to:

  • rzeczy do rozważenia;
  • doprecyzuj to wyszukiwanie;
  • poszerz to wyszukiwanie.

Wygląda to mniej więcej tak:

MUM już zaczyna zmieniać widok wyszukiwania na trzy sposoby:

  • rzeczy, które warto wiedzieć / Things to know;
  • zoom tematyczny / Topic zoom;
  • wizualne przeglądanie wyników wyszukiwania / Visually browsable search results.

Czym jest „things to know”, czyli ‘rzeczy, które warto wiedzieć’? Wyszukiwarka pokazała to na przykładzie frazy „acrylic painting”. Google zauważa,
że istnieje ponad 350 tematów związanych z tą frazą. Funkcja „rzeczy, które warto wiedzieć” zidentyfikuje najistotniejsze lub najpopularniejsze „ścieżki”, którymi użytkownicy podążają, zgłębiając dany temat i wyświetli na stronie więcej treści, które się do niego odnoszą. Zamiast więc czekać, aż użytkownicy przeprowadzą kolejne wyszukiwania, wyszukiwarka Google będzie przewidywać te powiązane tematy i udostępniać treści – jest
to więc dokładnie to, na co wskazywaliśmy wcześniej: MUM ma za zadanie usprawnić sposób, w jaki sprawdzamy treści w Internecie.

A jak to ma wyglądać w praktyce?

Zoom tematyczny z kolei ma pozwolić na „wskoczenie/wyskoczenie” z powiązanych tematów. Osoba wyszukująca może poszerzyć temat lub zawęzić go do bardziej szczegółowego wątku.

„Poszerz to wyszukiwanie” to akurat rzecz, która jest już dostępna w części wyszukiwań. Odnosi się do wyszukiwań związanych z inspiracjami – jak „inspiracje na Halloween” itd. Zapewne chodzi tutaj o featured snippets, jak sekcja „podobne pytania”.

Parę słów na koniec, czyli małe podsumowanie

Trudno więc oprzeć się wrażeniu, że MUM (chociaż z pewnością wiele zmieni) nie jest rewolucją, a ewolucją – a angażujące treści, które odpowiadają na pytania użytkowników, wciąż są i będą w cenie. Pozostaje jednak zagadnienie, które trudno teraz ocenić, czyli jak MUM wpłynie na ideę Internetu bez granic ‒ takiego, który nie jest skrępowany niczym, w tym językiem czy formą treści. Na to pytanie nie jesteśmy w stanie odpowiedzieć bez spoglądania w kulę jasnowidza Jackowskiego. Warto jednak pamiętać, że to, co było nie do wyobrażenia jeszcze parę lat temu, jest naszą teraźniejszością.

Michał Szylko
Team Leader SEO w Grupa iCEA
W swojej pracy łączy analityczne podejście z technicznym zacięciem. Na co dzień zajmuje się tworzeniem długoterminowych strategii dla swoich klientów i ich realizacją. Na bieżąco śledzi trendy i nowości rynkowe, tak by w pracy być przygotowanym na wszystko.