Wykorzystanie sztucznej inteligencji (ang. artificial intelligence; AI) nie jest już nie tylko obietnicą przyszłości. Od 2018 roku Samsung z powodzeniem rozwija zastosowaną w telewizorach QLED technologię poprawy jakości obrazu, czyli Inteligentnego Skalowania [1], która bazuje właśnie na AI. Dzięki tej innowacji dziś już ponad 100 tys. polskich widzów ogląda ulubione filmy w jakości możliwie bliskiej 8K lub 4K.
Technologia Inteligentnego Skalowania do 4K czy 8K przyniosła rozwiązanie konkretnego problemu, który narastał wraz ze zmianą preferencji widzów, co do wielkości telewizorów i oczekiwań względem materiałów nagranych w latach 60. czy 70. czy w starszych formatach. Materiały wideo o niskiej rozdzielczości odtwarzane na ekranie wysokiej rozdzielczości – pod względem jakości obrazu, jego wyrazistości – mogą pozostawiać wiele do życzenia. Większy ekran to po prostu większe wymagania względem rozdzielczości.
Trening czyni mistrza
Dostępne w telewizorach QLED 4K i 8K Inteligentne Skalowanie to technologia, która działa na bazie AI. Poprzez analizę danych i ich inteligentną adaptację, treści o niskiej rozdzielczości są korygowane, aby zapewnić im bardziej wyrazistą i naturalną jakość.
Wykorzystywane w tej technologii uczenie maszynowe polega na tym, że stworzony przez programistów algorytm inteligentnie analizuje różnorodne cechy materiału wideo (w tym linie, światło i kolor) i poprawia je, podwyższając tym samym rozdzielczość treści. Dzięki temu telewizor analizuje i przetwarza cechy nagrania, jednocześnie ucząc się w oparciu o sztuczną sieć neuronową, działającą analogicznie do ludzkiego mózgu.
Pracujący nad rozwojem tej technologii zespół Samsung Picture Quality Solution Lab skupiał się na stworzeniu algorytmów głębokiego uczenia się, które pozwoliłyby ekranom niezmiennie prezentować wideo w najwyższej jakości bez konieczności jakiejkolwiek interwencji ze strony użytkownika. Zdaniem Hyungjun Lim, który opracował działającą w ramach technologii Inteligentnego Skalowania metodę generowania tekstury – Głębokie uczenie się umożliwia precyzyjniejsze i skuteczniejsze podniesienie jakości obrazu niż to, jakie osiągnąć możemy sami i bez pomocy tego rozwiązania.
Ta właśnie przewaga maszynowego uczenia się skłoniła zespół Samsung do stworzenia technologii Inteligentnego Skalowania, w której połączono uczenie maszynowe z głębokim. Uczenie maszynowe polega na technologicznym zapamiętywaniu pewnych wzorców i zachowań, które maszyna już kiedyś sprawdziła i zapamiętała. Głębokie uczenie jest z kolei podkategorią uczenia maszynowego i opiera się na tworzeniu sieci neuronowych, które mają za zadanie udoskonalić technikę rozpoznawania detali obrazu czy głosu. Tak powstał Procesor Quantum 8K wykorzystujący sztuczną inteligencję.
– Wcześniejsze technologie maszynowego uczenia się poprawiały ostrość obrazu, teraz jednak jesteśmy w stanie zaoferować także precyzyjniejsze odwzorowanie tekstury – wyjaśnił Hyunseung Lee, odpowiedzialny za opracowanie wzmocnionej ostrości krawędzi w ramach działania Procesora Quantum 8K. – W efekcie w bardziej naturalny sposób możemy podnosić do jakości 8K obrazy przedstawiające zróżnicowane tekstury, takie jak panoramy gór czy porośnięte trawą łąki.
Siła synergii
Choć głębokie uczenie się ma nieograniczony potencjał, zespół Samsung musiał zmierzyć się z wyzwaniami. Aby znaleźć najlepsze rozwiązanie trzeba było przetestować niezliczone scenariusze.
– Na początku pewną trudność stanowiło dla nas śledzenie i zrozumienie algorytmu tworzonego przez sztuczną sieć neuronową procesora – wspomina Cheon Lee, który opracował strukturę sieci i metodę uczenia się Procesora Quantum 8K. – Musieliśmy też zaradzić temu, że układy sztucznej sieci neuronowej zużywały znaczną część mocy.
Ostatecznie udało się pokonać przeszkody. Projektanci postawili na technologię hybrydową, łączącą różne aspekty głębokiego i maszynowego uczenia się. W efekcie powstał procesor, który w wydajny sposób generuje wysoką jakość obrazu.
Wykorzystanie sztucznej inteligencji nie ogranicza się do technologii skalowania. Można zastosować ją do poprawy jakości wyświetlania na wiele sposobów, np. w ramach kategoryzacji jakości wideo, eliminacji szumów czy odwrócenia zniekształceń spowodowanych kompresją danych.