Wojciech Furmankiewicz, dyrektor Red Hat ds. technologii i rozwiązań w regionie Europy Środkowo-Wschodniej
Rozwój sztucznej inteligencji zmienia sposób, w jaki firmy i społeczeństwa korzystają z innowacyjnych rozwiązań, ale rodzi też pytania o to, kto i na jakich zasadach nadzoruje jej postęp. O przyszłości tej technologii zadecydują nie tylko algorytmy, ale także dążenie do demokratyzacji dostępu i tworzenia bardziej inkluzywnych, otwartych innowacji. Tempo zmian jest błyskawiczne, ale jedno pozostaje niezmienne – otwarte podejście do AI to klucz do jej odpowiedzialnego i zrównoważonego rozwoju.
Inkluzywność, dostępność i współpraca społeczności programistów od dekad umożliwiają tworzenie otwartego oraz bezpiecznego oprogramowania, które stanowi motor napędowy dla innowacyjności i fundament globalnej infrastruktury IT. W Red Hat uważamy, że wykorzystanie tych samych zasad w rozwoju AI może uczynić ją bardziej odpowiedzialną i mniej podatną na uprzedzenia (z ang. bias). Choć sztucznej inteligencji nie należy traktować tak samo jak oprogramowanie open source, istnieje wiele analogii między strukturą dużych modeli językowych a otwartym oprogramowaniem. Mimo że są to osobne dziedziny, wspólnym mianownikiem jest z pewnością otwarte podejście i możliwości współtworzenia przez społeczność open source.
Dostrajanie sztucznej inteligencji
W przeciwieństwie do tradycyjnych aplikacji IT, które budowane są na podstawie kodu źródłowego, modele AI bazują na tzw. wagach, czyli zestawach liczb decydujących o tym, jak system analizuje dane i generuje odpowiedzi. Wagi powstają w wyniku długiego procesu trenowania modelu na ogromnych zbiorach informacji. Niekiedy dane treningowe przyrównywane są do kodu źródłowego modelu AI, jednak stanowi to pewnego rodzaju uproszczenie.
W świecie open source kod źródłowy jest podstawowym środkiem do poznania oprogramowania i wprowadzania w nim zmian. W przypadku sztucznej inteligencji same dane treningowe nie wystarczą, aby zrozumieć w jaki sposób działa konkretny algorytm. Proces ich przetwarzania i trenowania jest tak złożony, że pojedyncza próbka danych ma tylko pośredni wpływ na efekt końcowy, co utrudnia pełną kontrolę nad modelem. Większość ulepszeń modeli AI nie wymaga zresztą dostępu do oryginalnych danych treningowych. Zamiast tego zmiany dokonywane są na podstawie modyfikacji wag modelu lub w procesie „dostrajania” (fine-tuning), który pozwala na precyzyjne dopasowanie AI do konkretnych zastosowań.
Warto zauważyć, że etap dostosowywania modeli AI do wymagań biznesowych może być kosztowny, ale nie musi. Zastosowanie technologii vLLM pozwala optymalizować wykorzystanie zasobów obliczeniowych, efektywniej zarządzać pamięcią i przetwarzać większą liczbę zapytań jednocześnie. Dzięki temu proces dostrajania modeli jest szybszy i tańszy, a firmy mogą skuteczniej wdrażać i skalować AI, nawet przy ograniczonych zasobach infrastrukturalnych.
AI otwarte, czyli jakie?
Aby można było mówić o otwartej sztucznej inteligencji, modele AI muszą spełniać dwa podstawowe warunki. Po pierwsze, ich wagi powinny być dostępne w ramach licencji open source, zapewniającej te same prawa i zasady działania, jakie obowiązują w przypadku klasycznego oprogramowania open source. Po drugie, zaimplementowane w kodzie mechanizmy ich działania muszą bazować na otwartych technologiach. Istotnym elementem jest również dążenie do zwiększania przejrzystości procesu trenowania i dostrajania sztucznej inteligencji, a także zacieśnianie współpracy społeczności IT z instytucjami regulującymi prawo oraz przedsiębiorcami.
Jednym z wyzwań dotyczących rozwijania systemów AI jest to, że w ich ulepszaniu często bierze udział tylko wąska grupa specjalistów zajmujących się danymi. Tymczasem eksperci z różnych branż – od medycyny po prawo – mogą wnosić cenną wiedzę do procesów trenowania modeli. Dlatego tak ważne jest, aby sztuczna inteligencja była dostępna i otwarta dla jak najszerszego grona społeczności, instytucji i firm, a nie tylko wąskiego grona podmiotów technologicznych.
Przykładem takiego podejścia jest stworzony przez Red Hat i IBM projekt InstructLab. To narzędzie pozwalające osobom spoza świata data science na aktywne współtworzenie modeli AI poprzez dostarczanie swojej specjalistycznej wiedzy. Dzięki temu przedstawiciele różnych branż i biznesu mogą wpływać na rozwój sztucznej inteligencji, sprawiając, że lepiej odpowiada ona na konkretne wyzwania gospodarcze i naukowe. Ułatwia to transparentny i inkluzywny rozwój AI, a także sprzyja tworzeniu mniejszych, bardziej wyspecjalizowanych modeli do konkretnych zastosowań biznesowych.
Infrastruktura i optymalizacja
Rozwój sztucznej inteligencji open source nie kończy się na samych modelach – równie istotna jest infrastruktura, na której działa AI. Dla tworzenia sztucznej inteligencji w duchu open source kluczowe jest dostarczanie elastycznych narzędzi umożliwiających budowanie, wdrażanie i zarządzanie modelami w różnych środowiskach. Otwarte technologie, takie jak Kubernetes czy KubeFlow, odgrywają tu istotną rolę, zapewniając skalowalność oraz integrację różnych systemów IT. Ważne jest także wykorzystanie chmury hybrydowej, która pozwala na elastyczność w doborze odpowiednich zasobów do konkretnych zastosowań AI. Możliwość optymalizacji wydajności i kosztów sprawia, że firmy mogą lepiej dostosowywać modele do swoich potrzeb, niezależnie od miejsca ich wdrożenia.