Facebook, Media społecznościowe, Najnowsze, Przydatne narzędzia, Social media, Technologie

Kolejny ukłon Facebooka w stronę niewidomych i niedowidzących

W 2015 roku na całym świecie było aż 253 milionów osób niedowidzących, z czego 36 milionów kompletnie niewidomych. Świat nieustannie walczy o ułatwianie egzystencji osobom z takimi i innymi niepełnosprawnościami; istnieją społeczności i organizacje, które robią wszystko, aby uprościć im życie i sprawić, by byli jak najbardziej samodzielni. Szczęśliwie obecna technologia umożliwia im wiele rzeczy, m.in. korzystanie z sieci, a to za sprawą czytników ekranowych i monitorów brajlowskich. Te pierwsze to po prostu oprogramowania, które konwertują tekst na mowę z syntezatora, te drugie z kolei w czasie rzeczywistym są w stanie tłumaczyć tekst na alfabet Braille’a, który wyświetlany jest na specjalnym monitorze-panelu.

No właśnie – tekst. Co jednak w przypadku wszelkich zdjęć, grafik czy infografik? Większości zapewne znany jest atrybut alt, który stosuje się podczas opisywania elementów wizualnych przy budowaniu strony internetowej. Jest on pomocny nie tylko w sytuacji, gdy zamieszczona grafika nie wyświetli się z powodu błędu, ale też w przypadku gdy niewidomy czyta stronę i zwyczajnie chce choćby pokrótce wiedzieć, co się na niej znajduje. Facebook już w 2016 roku rozpoczął prace nad automatycznym przyporządkowywaniem opisów do zdjęć na portalu. Początkowo system AAT (Alternative Automatic Text) był jednak w stanie rozpoznać około 100 obiektów, były to więc opisy bardzo ogólne. Kolejne prace w 2018 r. polegały na większym zaangażowaniu technologii AI oraz wykorzystaniu hashtagów. Oszczędzają one poniekąd czas autorom narzędzia, ponieważ użytkownicy sami kategoryzują dzięki nim swoje zdjęcia. Korzystając z bazy 3,5 miliarda zdjęć z 17 tys. hashtagami, twórcy AAT osiągnęli aż 85,4% dokładności w opisach grafik!

Najnowsza aktualizacja narzędzia przyniosła wzrost skuteczności w rozpoznawaniu zawartości zdjęć o ponad 10 razy, co oznacza, że liczba grafik na Facebooku, której pozostają bez opisu dla niewidomych i niedowidzących, może zmniejszać się o wiele szybciej. Opisy są też o wiele bardziej szczegółowe: AAT jest w stanie rozpoznawać typy krajobrazów, aktywności, rodzaje zwierząt, a nawet zabytki! Możliwe jest także określenie pozycji osób oraz elementów krajobrazu znajdujących się na zdjęciu (bliżej, dalej, na pierwszym planie, w tle, w środku itd.). Oprócz tego Facebook zadbał o umiejętność rozpoznawania koloru skóry, określania przybliżonego wieku, a nawet… zwyczajów kulturowych – algorytmy są już bowiem w stanie rozpoznać z jakiego rejonu świata pochodzi weselne zdjęcie!

Używając techniki uczenia transferowego, która polega na wykorzystywaniu przez mechanizm wiedzy nabytej przy rozwiązywaniu jednego problemu do rozwiązywania innych zagadnień, twórcy narzędzia byli w stanie wykreować modele odpowiadające za rozpoznawanie wspomnianych zabytków, typów jedzenia (frytki, makaron, ryż itd.), a nawet selfie. Co istotne – zawsze występuje prawdopodobieństwo błędu, dlatego opisy nie brzmią „Na zdjęciu znajduje się…”, a „Na zdjęciu może znajdować się…”.

przykład opisu zdjęcia przez system AAT na FBNajświeższe poprawki oparte są na feedbacku pochodzącym bezpośrednio od użytkowników systemów umożliwiających czytanie osobom niewidomym i niedowidzącym. Okazuje się, że nie w każdym przypadku liczy się dla nich bardzo dokładny opis zdjęcia. Najwięcej szczegółów dotyczących zawartości życzyliby sobie bowiem w przypadku, gdy zdjęcie dodaje ktoś z ich rodziny bądź znajomych. W przypadku grafik dodawanych np. przez fanpage tych informacji może być nieco mniej. 

Dla osób, które korzystają z tych opisów, to spory krok do przodu, który umożliwia o wiele lepsze zrozumienie czytanych przez system grafik. System AAT pracuje już w 45 językach i posługuje się raczej prostym słownictwem, co jest zrozumiałe. Wypowiedzi twórców narzędzia oraz przedstawicieli Facebooka sugerują, że obecny stan wiedzy ich systemu AI jest już naprawdę duży, jednak na pewno nie jest to jego ostateczna forma. Zapewne w przyszłości pojawią się kolejne informacje o pracach nad jego  dalszą rozbudową – zgodnie z potrzebami użytkowników i nowymi technologiami, które najpewniej zostaną dopiero przedstawione światu.

Zapraszam Cię na mój podcast!

Bohaterem każdego odcinka podcastu jest nieoczywiste słowo lub skrót stosowany na co dzień w agencjach marketingu internetowego, którego znaczenie wyjaśniamy wraz z moim gościem rozwijając temat konkretnymi przykładami, dzieląc się danymi i dostępnymi narzędziami.

Zobacz odcinki

Jeżeli potrzebujesz wsparcia przy projekcie internetowym lub szukasz agencji specjalizującej się w komunikacji marketingowej - skontaktuj się z nami.

Zapisz się na biuletyn redaktora naczelnego
Łukasza Wołka. Bezpłatne porady
i nowości marketingowe oraz newsy
z Abanana i Eura7 na Twojej skrzynce e-mail
już za 5 minut!
Pole "imię" nie jest obowiązkowe, ale jeżeli chcesz, żebyśmy zwracali się do Ciebie po imieniu, podaj nam je :)
loader
Dziękuję za zapisanie się do
mojego biuletynu.
Otwórz teraz swoją skrzynkę mailową, potwierdź zgody i aktywację. Sprawdź proszę, czy mail ode mnie nie wpadł do spamu albo do ofert.
CEO Łukasz Wołek ŁUKASZ WOŁEK, REDAKTOR NACZELNY LABBER.PL