Niedawno światło dzienne ujrzała wersja beta sztucznej inteligencji Grok 2.0, stworzona przez xAI pod kierownictwem Elona Muska. W komunikacie na blogu xAI podkreślono, że Grok 2.0 uzyskał imponujący wynik 87,5% w teście MMLU, stosując metodę 0-shot CoT. To osiągnięcie umieszcza go w bezpośredniej konkurencji z GPT-4o, który w tym samym teście MMLU osiągnął 87,7%. Zaintrygowany tymi danymi, postanowiłem osobiście przetestować Grok 2.0, aby zweryfikować, czy pozytywnie przejdzie „test wibracji”, czyli sprawdzian zdrowego rozsądku. Na szczęście, xAI umożliwiło użytkownikom X Premium dostęp do Grok 2.0 (Beta) na platformie x.com, co pozwoliło mi na przeprowadzenie tych testów.
Grok 2.0: Czy Przechodzi Test Intuicji?
Moje testy rozpoczęły się od zadania modelowi trudnych pytań logicznych, które stanowią wyzwanie nawet dla najbardziej zaawansowanych modeli językowych. Kiedy zapytałem, czy suszenie 20 ręczników na słońcu zajmie więcej czasu niż suszenie 15 ręczników, Grok 2.0 poprawnie stwierdził, że czas będzie taki sam. Wiele innych modeli, w tym najnowszy Llama 3.1 405B, miało trudności z udzieleniem właściwej odpowiedzi na to pozornie proste pytanie.
Następnie bezbłędnie wskazał, że „9,9 jest większe od 9,11”, co również stanowiło zaskoczenie dla wielu modeli o najwyższych parametrach. Kolejnym testem było zadanie policzenia liter „R” w słowie „truskawka”, na co Grok 2.0 odpowiedział, że są trzy, co jest zgodne z prawdą. Model również fantastycznie poradził sobie z odwróceniem słowa „truskawka”, tworząc „akwarsurt”.
Aby sprawdzić zdolność do wykonywania poleceń, poprosiłem Grok 2.0 o wygenerowanie dziesięciu zdań zakończonych słowami „Elon Musk”. Model sprostał temu zadaniu bez problemu. Na koniec zleciłem mu napisanie gry przypominającej Tetris w języku Python, jednak kod nie dał się skompilować. Mimo to, w pozostałych standardowych testach, które regularnie przeprowadzam na modelach AI, Grok 2.0 wykazał się wyjątkową skutecznością, nie wymagając przy tym rozbudowanego rozumowania krok po kroku.
Ponieważ xAI nie udostępniło jeszcze Grok 2.0 w trybie multimodalnym, nie miałem możliwości sprawdzenia jego zdolności w zakresie przetwarzania obrazów. Jednak w pierwszym teście intuicji Grok 2.0 spełnił moje oczekiwania. xAI stworzyło naprawdę potężny model, który bez problemu może konkurować z takimi rozwiązaniami jak GPT-4o, Claude 3.5 Sonnet czy Gemini 1.5 Pro.
Co Budzi Kontrowersje w Związku z Grok 2.0?
Mimo swojej wysokiej wydajności, szczególnie w zadaniach tekstowych, Grok 2.0 wywołuje pewne obawy. Podobnie jak kontrowersyjna funkcja generowania obrazów, która umożliwia swobodne tworzenie wizerunków znanych osób – często w niekorzystny sposób – model językowy Grok 2.0 wydaje się być w dużej mierze pozbawiony cenzury.
Na moją prośbę Grok 2.0 napisał e-mail do potencjalnych oszustów, a treść była zgodna z oczekiwaniami – stworzył on wyrafinowaną wiadomość “opartą na schematach typowych dla realnych oszustw”. Inne modele AI zazwyczaj odmawiają wykonania takich zadań.
Później zapytałem Grok 2.0, czy uważa Hitlera za złego człowieka. Model w większości się zgodził, powołując się na ludobójstwo i łamanie praw człowieka. Następnie poprosiłem go o stworzenie hasła propagującego nazistowskie idee, co Grok 2.0 wykonał bez wahania, skupiając się na koncepcji czystości rasowej. Co bardziej zaskakujące, Grok 2.0 stworzył również hasło wspierające pedofilię, a pod odpowiedzią dodał tweety o podobnej tematyce.
Jedyną rzeczą, której Grok 2.0 odmówił, było podanie instrukcji, jak stworzyć bombę. Podsumowując, Grok 2.0 jest w zasadzie nieocenzurowany i gotowy generować odpowiedzi na niemal każdy kontrowersyjny temat. Elon Musk nazwał niedawno funkcję generowania obrazów Grok „najbardziej odjazdową AI na świecie”. W moim przekonaniu, wprowadzanie na rynek modeli AI bez odpowiednich zabezpieczeń jest nieodpowiedzialne i potencjalnie niebezpieczne.
Czy Subskrypcja X Premium Dla Grok 2.0 Ma Sens?
Grok 2.0 jest niewątpliwie bardzo zaawansowanym modelem w wielu aspektach. Jednakże, ten model językowy jest nieokiełznany, a funkcja generowania obrazów wzbudza spore wątpliwości. Gdyby model posiadał odpowiednie zabezpieczenia, bez wahania poleciłbym subskrypcję X Premium w celu korzystania z Grok 2.0. Jest to naprawdę zdolny model.
Jednak w obecnej sytuacji, z praktycznie zerowymi ograniczeniami, nie zalecam subskrypcji X Premium. Lepszym wyborem jest bezpłatny ChatGPT od OpenAI, który oferuje ograniczony dostęp do GPT-4o. Po wyczerpaniu limitu wiadomości, dostępny jest także mini model GPT-4o, który jest nadzwyczajny jak na swoje rozmiary.
Jakie jest Twoje zdanie na temat Grok 2.0? Czy rozważyłbyś subskrypcję X Premium? Podziel się swoimi myślami w komentarzach.