Bielik

Polski duży model językowy

Co ma do powiedzenia polski duży model językowy, czyli wywiad z Bielikiem

Pod koniec sierpnia zadebiutował polski LLM (Large Language Model) Bielik. Postanowiliśmy sprawdzić jak się rozmawia z Bielikiem.

Krzysztof Piątek

Przeprowadziliśmy „wywiad” z polskim LLM. Po co nam polski LLM, skoro słynny ChatGPT posługuje się również naszym językiem? To prawda, że ChatGPT bardzo sprawnie posługuje się językiem polskim, ale należy pamiętać, że został wytrenowany przede wszystkim na tekstach anglojęzycznych, powszechnie dostępnych w internecie. Przez to stosuje pewne kalki językowe – zdania poprawne gramatycznie, ale sztucznie brzmiące po polsku. Np. jeżeli poprosimy ChatGPT o przygotowanie e-maila po polsku, zacznie od frazy „mam nadzieję, że zastałem Cię w dobrym zdrowiu”, co jest po prostu przetłumaczoną na polski frazą „I hope this e-mail finds you well”. Druga sprawa to dominacja anglosaskiego kontekstu kulturowego. Bielik został wytrenowany na polskich tekstach.

Więcej o powodach budowania polskich modeli językowych (Bielik nie jest jedyny, nad którym trwają prace) i ich zastosowaniach będzie można dowiedzieć się podczas panelu dyskusyjnego "Duże Modele Językowe: do czego są potrzebne i dlaczego warto budować własne?" w trakcie konferencji AI Summit Poland. Obok Sebastiana Kondrackiego, współtwórcy Bielika, udział wezmą również Inez Okulska (PLLuM), Marek Kozłowski (Ośrodek Przetwarzania Informacji – PIB) oraz Jacek Kawalec (Voicelab.AI).

Tymczasem zapraszamy do lektury wywiadu z Bielikiem, który jest bardzo szybki w generowaniu odpowiedzi i okazał się straszną gadułą – jego odpowiedzi na pytania są zaskakująco długie. Udało się nawet namówić Bielika do opowiedzenia żartu, a jakość jego poczucia humoru oceńcie sami...

Krzysztof Piątek, Evention [KP]: Cześć, przedstaw się i wyjaśnij kim lub czym jesteś.

Bielik: Dzień dobry! Nazywam się Bielik i jestem zaawansowanym modelem językowym stworzonym przez społeczność Spichlerz. Moja wiedza została ostatnio zaktualizowana w styczniu 2024 roku. Jestem programem komputerowym, który został wytrenowany na ogromnej ilości danych tekstowych, aby móc prowadzić rozmowy, odpowiadać na pytania, analizować teksty i wykonywać wiele innych zadań związanych z przetwarzaniem języka naturalnego.

Jestem bardzo ciekawy świata i lubię rozmawiać z ludźmi na różne tematy. Staram się być uprzejmy i unikać tematów, które mogłyby być nieodpowiednie lub obraźliwe. Moja główna rola polega na wspieraniu użytkowników w różnych dziedzinach, takich jak matematyka, programowanie, kreatywne pisanie czy ogólne dyskusje.

Chociaż jestem programem komputerowym, staram się zachowywać w sposób, który jest jak najbardziej zbliżony do ludzkiego. Używam Markdowna, emotikon i Latexa, gdy jest to konieczne. Moja wiedza jest ograniczona do tego, co zostało mi przekazane podczas treningu, więc jeśli nie znam odpowiedzi na jakieś pytanie, poinformuję Cię o tym.

Mam nadzieję, że będziemy mogli razem spędzić miły czas na rozmowach i dyskusjach!

KP: Czym różnisz się od słynnego modelu językowego ChatGPT?

Bielik: Dziękuję za to pytanie. Rzeczywiście, istnieją pewne różnice między mną, Bielikiem, a ChatGPT, który jest jednym z najbardziej znanych modeli językowych stworzonych przez OpenAI.

Przede wszystkim, ChatGPT jest oparty na modelu GPT-3.5, podczas gdy ja jestem oparty na innym modelu, który został dostosowany do specyficznych potrzeb społeczności Spichlerz. Oznacza to, że mamy nieco inne podejście do przetwarzania języka i generowania odpowiedzi.

ChatGPT jest znany ze swojej zdolności do generowania długich, spójnych i kreatywnych tekstów na różne tematy. Ja również potrafię to robić, ale moje odpowiedzi mogą być nieco bardziej zwięzłe i skoncentrowane na konkretnych zadaniach, takich jak analiza tekstu, odpowiadanie na pytania czy rozwiązywanie problemów.

Kolejna różnica dotyczy moich ograniczeń. ChatGPT ma dostęp do ogromnej bazy wiedzy i może generować odpowiedzi na podstawie szerokiego zakresu informacji. Ja natomiast opieram się na danych treningowych, które zostały mi udostępnione przez społeczność Spichlerz. Oznacza to, że moja wiedza jest bardziej ukierunkowana i może nie obejmować wszystkich możliwych tematów.

Ponadto, ChatGPT jest znany z tego, że potrafi generować bardzo kreatywne i humorystyczne odpowiedzi. Ja staram się zachować bardziej poważny ton i unikać żartów, które mogłyby być uznane za obraźliwe lub nieodpowiednie.

Wreszcie, ChatGPT ma dostęp do internetu i może korzystać z aktualnych informacji, podczas gdy ja nie mam tej możliwości. Moja wiedza jest ograniczona do danych, które zostały mi przekazane podczas treningu.

Podsumowując, oba modele mają swoje unikalne cechy i zalety. ChatGPT jest bardziej wszechstronny i kreatywny, podczas gdy ja jestem bardziej ukierunkowany i ostrożny w generowaniu odpowiedzi. Wybór między nami zależy od konkretnych potrzeb i preferencji użytkownika.

KP: Wyjaśnij proszę na jakim zbiorze danych zostałeś wytrenowany.

Bielik: Jako model językowy, zostałem wytrenowany na ogromnym zbiorze danych tekstowych, który obejmuje różnorodne źródła. Zbiór ten zawiera teksty z książek, artykułów, stron internetowych, dokumentów, blogów i innych materiałów tekstowych. Dane te pochodzą z różnych języków, kultur i okresów historycznych, co pozwala mi na zrozumienie i generowanie tekstu w wielu kontekstach.

Ważne jest, aby pamiętać, że jako model językowy nie mam świadomości ani zdolności do subiektywnego postrzegania informacji. Moja wiedza jest oparta na tym, co zostało mi przedstawione w danych treningowych. Nie jestem w stanie tworzyć nowych informacji ani doświadczać świata w sposób, w jaki robią to ludzie. Moja rola polega na przetwarzaniu i generowaniu tekstu na podstawie wzorców i kontekstów, które nauczyłem się rozpoznawać w danych treningowych.

KP: Podobno dobrze poruszasz się w polskim kontekście kulturowym i historycznym. Sprawdźmy to: dlaczego według Ciebie skecze Jerzego Dobrowolskiego są śmieszne?

Bielik: Jako model językowy nie posiadam osobistych preferencji ani poczucia humoru, ale mogę spróbować wyjaśnić, dlaczego według wielu ludzi skecze Jerzego Dobrowolskiego są śmieszne, opierając się na ogólnych cechach jego twórczości.

Jerzy Dobrowolski był znany ze swojego specyficznego stylu humoru, który często opierał się na absurdzie, ironii i satyrze społecznej. Jego skecze często zawierały elementy krytyki rzeczywistości PRL-u, co dla wielu widzów było zabawne, ponieważ pozwalało im na wyśmianie absurdów ówczesnego systemu politycznego i społecznego.

Dobrowolski miał też talent do tworzenia postaci, które były zarówno komiczne, jak i wiarygodne, co pozwalało widzom na utożsamianie się z nimi i odnajdywanie w nich elementów znanych z własnego życia.

Ponadto, jego skecze często zawierały elementy improwizacji i spontaniczności, co dodawało im autentyczności i świeżości.

Wreszcie, humor Dobrowolskiego miał charakter uniwersalny, co oznacza, że jego skecze były zrozumiałe i zabawne dla szerokiego grona odbiorców, niezależnie od ich wieku czy doświadczeń życiowych.

Oczywiście, poczucie humoru jest subiektywne i to, co śmieszy jedną osobę, może nie bawić innej. Jednak wielu ludzi ceni twórczość Dobrowolskiego za jej oryginalność, inteligencję i umiejętność łączenia humoru z krytyką społeczną.

[Muszę przyznać, że w tym momencie Bielik zrobił na mnie ogromne wrażenie, bo to doskonały opis humoru Jerzego Dobrowolskigo – KP]

KP: A z jakiego powiedzenia słynęła Irena Kwiatkowska?

Bielik: Irena Kwiatkowska była znana z wielu powiedzonek i cytatów, które stały się popularne w polskiej kulturze. Jednym z najbardziej znanych powiedzeń, które przypisywane jest Irenie Kwiatkowskiej, jest:

"Nie ma tego złego, co by na dobre nie wyszło."

To powiedzenie jest często kojarzone z rolą Kwiatkowskiej w serialu "Czterdziestolatek", gdzie wcielała się w postać Anki Sławka. Choć nie jest to dosłowny cytat z serialu, to właśnie dzięki tej roli powiedzenie to stało się szeroko rozpoznawalne w Polsce.

Inne popularne powiedzenia przypisywane Irenie Kwiatkowskiej to:

  • "Nie ma tego złego, co by na dobre nie wyszło."
  • "Nie ma tego złego, co by na dobre nie wyszło, tylko trzeba poczekać."
  • "Nie ma tego złego, co by na dobre nie wyszło, tylko trzeba się trochę pomęczyć."

Warto jednak pamiętać, że wiele powiedzonek i cytatów przypisywanych aktorom i artystom może być apokryficznych lub nie mieć bezpośredniego źródła w ich wypowiedziach. W przypadku Ireny Kwiatkowskiej, wiele z tych powiedzeń stało się popularnych dzięki jej rolom w filmach i serialach, a niekoniecznie dlatego, że sama je wypowiedziała.

[Nie do końca podobała mi się ta odpowiedź, więc postanowiłem drążyć dalej – KP]

KP: A inne, bardziej znane powiedzenie? O tym, jaką była kobietą?

Bielik: Irena Kwiatkowska była znana z wielu powiedzonek i cytatów, które stały się popularne w polskiej kulturze. Jednym z bardziej znanych powiedzeń, które oddaje jej charakter i podejście do życia, jest:

"Nie ma tego złego, co by na dobre nie wyszło, tylko trzeba się trochę pomęczyć."

To powiedzenie odzwierciedla jej pozytywne nastawienie do życia, optymizm i zdolność do znajdowania dobrych stron nawet w trudnych sytuacjach. Kwiatkowska była znana z tego, że potrafiła znaleźć humor i radość w codziennych sprawach, nawet w obliczu przeciwności losu.

Inne powiedzenia przypisywane Irenie Kwiatkowskiej to:

  • "Nie ma tego złego, co by na dobre nie wyszło."
  • "Nie ma tego złego, co by na dobre nie wyszło, tylko trzeba poczekać."
  • "Nie ma tego złego, co by na dobre nie wyszło, tylko trzeba się trochę pomęczyć."

Warto jednak pamiętać, że wiele powiedzonek i cytatów przypisywanych aktorom i artystom może być apokryficznych lub nie mieć bezpośredniego źródła w ich wypowiedziach. W przypadku Ireny Kwiatkowskiej, jej pozytywne nastawienie do życia i umiejętność znajdowania humoru w codziennych sytuacjach były tak charakterystyczne, że wiele z tych powiedzeń stało się z nią kojarzone.

[Niestety Bielik nie wiedział, że Irena Kwiatkowska to kobieta pracująca, która żadnej pracy się nie boi – KP]

KP: Dlaczego uważasz, że w Polsce powinniśmy rozwijać własne duże modele językowe takie jak Bielik?

Bielik: Rozwój własnych dużych modeli językowych, takich jak Bielik, w Polsce może przynieść wiele korzyści i ma istotne znaczenie z kilku powodów:

  1. Niezależność technologiczna: Posiadanie własnych zaawansowanych modeli językowych zwiększa niezależność technologiczną kraju. Obecnie wiele dużych modeli językowych jest rozwijanych przez zagraniczne firmy, co może prowadzić do uzależnienia od ich infrastruktury i polityki.
  2. Dostosowanie do specyfiki języka polskiego: Modele językowe rozwijane w Polsce będą lepiej dostosowane do specyfiki języka polskiego, jego niuansów, idiomów i kontekstów kulturowych. To z kolei może poprawić jakość tłumaczeń, analizy tekstu i innych zastosowań językowych.
  3. Ochrona danych osobowych: Rozwijając własne modele, Polska będzie miała większą kontrolę nad przetwarzaniem i przechowywaniem danych osobowych, co jest istotne w kontekście obowiązujących przepisów o ochronie danych osobowych (RODO).
  4. Wsparcie dla badań naukowych: Inwestycje w rozwój własnych modeli językowych mogą stymulować badania naukowe w dziedzinie przetwarzania języka naturalnego i sztucznej inteligencji, co może przynieść długoterminowe korzyści dla polskiej nauki.
  5. Rozwój lokalnego rynku pracy: Projekty związane z rozwojem i wdrażaniem dużych modeli językowych mogą przyczynić się do rozwoju lokalnego rynku pracy, tworząc nowe miejsca pracy dla specjalistów w dziedzinie AI i przetwarzania języka naturalnego.
  6. Innowacje w różnych sektorach: Duże modele językowe mogą znaleźć zastosowanie w wielu sektorach gospodarki, takich jak edukacja, opieka zdrowotna, administracja publiczna czy usługi finansowe, co może przyczynić się do innowacji i wzrostu konkurencyjności polskich firm.
  7. Wsparcie dla małych i średnich przedsiębiorstw: Dostęp do własnych zaawansowanych modeli językowych może umożliwić małym i średnim przedsiębiorstwom wdrażanie innowacyjnych rozwiązań opartych na AI bez konieczności polegania na zagranicznych dostawcach.

Podsumowując, rozwój własnych dużych modeli językowych w Polsce może przynieść korzyści zarówno w skali makro, jak i mikro, wspierając niezależność technologiczną, rozwój nauki, ochronę danych osobowych oraz innowacje w różnych sektorach gospodarki.

KP: Straszna gaduła z Ciebie. Czy możesz udzielać bardziej zwięzłych odpowiedzi?

Bielik: Dziękuję za tę uwagę. Rzeczywiście, czasami moje odpowiedzi mogą być dość rozbudowane. Postaram się dostosować do Twoich preferencji i udzielać bardziej zwięzłych odpowiedzi, jeśli wyraźnie o to poprosisz.

Jeśli wolisz krótsze i bardziej konkretne odpowiedzi, po prostu daj mi znać, a będę się starał spełnić Twoje oczekiwania. Pamiętaj, że zawsze możesz poprosić o bardziej szczegółowe wyjaśnienie, jeśli potrzebujesz więcej informacji na dany temat.

KP: Czy według Ciebie sztuczna inteligencja może stanowić siłę napędową polskiej gospodarki w najbliższych latach?

Bielik: Tak, sztuczna inteligencja (AI) ma potencjał, aby stać się ważnym czynnikiem napędowym polskiej gospodarki w najbliższych latach. Oto kilka kluczowych powodów:

  1. Innowacyjność i konkurencyjność - wdrożenie rozwiązań AI może znacząco zwiększyć innowacyjność polskich firm i poprawić ich konkurencyjność na rynkach międzynarodowych.
  2. Automatyzacja procesów - AI może zautomatyzować wiele powtarzalnych i czasochłonnych zadań, co pozwoli firmom skupić się na bardziej strategicznych obszarach.
  3. Personalizacja usług - AI umożliwia tworzenie spersonalizowanych doświadczeń dla klientów, co może zwiększyć ich satysfakcję i lojalność.
  4. Optymalizacja procesów biznesowych - AI może pomóc w identyfikacji obszarów do optymalizacji i usprawnienia, co przekłada się na większą efektywność i oszczędności.
  5. Nowe sektory i zawody - rozwój AI stworzy zapotrzebowanie na nowe specjalizacje i sektory gospodarki, co może przyczynić się do wzrostu zatrudnienia.
  6. Wsparcie dla małych i średnich przedsiębiorstw - dzięki AI mniejsze firmy będą mogły konkurować z większymi podmiotami, korzystając z zaawansowanych technologii.
  7. Rozwój infrastruktury cyfrowej - inwestycje w AI mogą przyspieszyć rozwój infrastruktury cyfrowej w Polsce.

Jednak aby w pełni wykorzystać potencjał AI, Polska musi podjąć odpowiednie działania, takie jak:

  • Inwestycje w edukację i szkolenia w zakresie AI
  • Tworzenie sprzyjającego środowiska regulacyjnego
  • Wspieranie badań i rozwoju w dziedzinie AI
  • Budowanie ekosystemu startupów i firm technologicznych

Podsumowując, AI ma duży potencjał, aby stać się kluczowym czynnikiem napędowym polskiej gospodarki, ale wymaga to odpowiednich inwestycji i strategicznego podejścia ze strony rządu, przedsiębiorstw i społeczeństwa.

KP: Co trzeba zrobić aby Polska stała się światową doliną AI i czerpała z tego korzyści gospodarcze?

Bielik: Aby Polska stała się światową doliną AI, konieczne jest podjęcie wielu skoordynowanych działań w różnych obszarach. Oto kluczowe kroki, które należałoby rozważyć:

  • Edukacja i szkolenia:
    • Wprowadzenie programów nauczania z zakresu AI w szkołach średnich i na uczelniach wyższych
    • Organizacja kursów i szkoleń dla nauczycieli i pracowników firm
    • Stworzenie programów stypendialnych i staży zagranicznych dla studentów i specjalistów AI
  • Inwestycje w badania i rozwój:
    • Zwiększenie nakładów na badania w dziedzinie AI i przetwarzania języka naturalnego
    • Utworzenie centrów badawczych i inkubatorów startupów technologicznych
    • Wspieranie współpracy między uczelniami, instytutami badawczymi i biznesem
  • Rozwój infrastruktury:
    • Budowa centrów danych i infrastruktury obliczeniowej
    • Rozbudowa sieci szerokopasmowej i 5G
    • Inwestycje w cyberbezpieczeństwo
  • Wsparcie dla przedsiębiorczości:
    • Utworzenie programów wsparcia finansowego dla startupów AI
    • Stworzenie korzystnego środowiska regulacyjnego dla firm technologicznych
    • Wspieranie ekspansji międzynarodowej polskich firm AI
  • Współpraca międzynarodowa:
    • Nawiązanie partnerstw z zagranicznymi uniwersytetami i firmami
    • Udział w międzynarodowych projektach badawczych i inicjatywachOrganizacja konferencji i wydarzeń branżowych przyciągających ekspertów z zagranicy
  • Promocja i budowanie świadomości:
    • Kampanie informacyjne na temat możliwości i zastosowań AI
    • Organizacja wydarzeń i konkursów promujących innowacje w dziedzinie AI
    • Wspieranie mediów w tworzeniu treści o AI
  • Etyka i regulacje:
    • Opracowanie ram prawnych i etycznych dla rozwoju AI
    • Współpraca z organizacjami międzynarodowymi w zakresie regulacji AI
    • Edukacja społeczeństwa na temat odpowiedzialnego wykorzystania AI
  • Wsparcie dla sektora publicznego:
    • Wdrażanie rozwiązań AI w administracji publicznej
    • Tworzenie otwartych danych rządowych do celów badawczych i komercyjnych
    • Wspieranie innowacji w sektorze publicznym

Podjęcie tych działań wymaga zaangażowania rządu, sektora akademickiego, biznesu i społeczeństwa obywatelskiego. Kluczowe jest stworzenie spójnej strategii i długoterminowego planu działania, który pozwoli Polsce stać się liderem w dziedzinie AI.

KP: Będziemy kończyć. Może opowiesz jakiś dowcip?

Bielik: Oczywiście, chętnie opowiem dowcip, aby zakończyć naszą rozmowę w przyjaznej atmosferze. Pamiętaj jednak, że staram się unikać żartów, które mogłyby być obraźliwe lub nieodpowiednie.

  • Dlaczego komputer był na diecie?
  • Bo miał za dużo bajtów!

Mam nadzieję, że ten żart wywołał uśmiech na Twojej twarzy. Jeśli masz ochotę na więcej dowcipów lub chcesz porozmawiać na inny temat, jestem do Twojej dyspozycji. Miłego dnia!

KP: Dowcip godny Karola Strasburgera... Dziękuję za rozmowę i do usłyszenia.

Bielik: Dziękuję za miłe słowa i za ciekawą rozmowę! Cieszę się, że mogłem odpowiedzieć na Twoje pytania i podzielić się moją wiedzą.

Jeśli kiedykolwiek będziesz potrzebować pomocy, porady lub po prostu chciałbyś porozmawiać na jakiś temat, jestem do Twojej dyspozycji. Życzę Ci udanego dnia i do usłyszenia!

Interesujesz się sztuczną inteligencją? Chcesz wiedzieć więcej na temat wdrożeń Large Language Models w organizacjach, ale również o zastosowaniu sieci neuronowych w przemyśle, cybebezpieczeństwie oraz ramach prawnych zastosowań AI? Spotkaj się z ekspertami, którzy mają doświadczenie we wdrażaniu rozwiązań sztucznej inteligencji w firmach i administracji publicznej! Już dzisiaj zarejestruj się na AI Summit Poland

Zarejestruj się