דיגיטל וטק
ChatGPT מול Grok של מאסק: מי חשוד בניפוח נתונים?
עובד ב-OpenAI מאשים את xAI בניפוח נתוני השוואות הביצועים של מודל Grok 3 ביחס ל-ChatGPT, מה שעלול להטעות משתמשים. האם החברה של מאסק באמת ניפחה נתונים, או שזו פשוט עוד שיטה להצגת נתונים?

חברת הבינה המלאכותית xAI של אילון מאסק מואשמת בעיוות נתוני ביצועים של מודל הבינה המלאכותית החדש שלה, Grok 3, כך שהמשתמשים קיבלו רושם מוטעה מהשיגי המודל החדש. עובד של המתחרה OpenAI טוען כי xAI השמיטה נתון חשוב בהשוואה מול מודלים של OpenAI, מה שעלול ליצור רושם שגוי על ביצועי המודל.
xAI פרסמה גרף שבו מוצגים ביצועי Grok 3 Reasoning Beta ו-Grok 3 mini Reasoning במבחן AIME 2025, מבחן מתמטי תחרותי המשמש לעיתים כאומדן ליכולות AI. הגרף הציג את Grok 3 כעוקף את o3-mini-high של OpenAI, אך אנשי OpenAI מיהרו לציין כי הנתון שהושמט מההשוואה הוא cons@64 - מדד שמעניק למודל 64 ניסיונות לכל שאלה, ובוחר בתשובה הנפוצה ביותר. שילוב נתון זה עשוי לשנות את התוצאות באופן משמעותי. בהשוואה לנתון @1 (הניסיון הראשון של כל מודל לענות על השאלות), Grok 3 אכן מפגר מאחורי o3-mini-high של OpenAI ואף נותר מעט מאחור ביחס לדגם o1 medium. למרות זאת, xAI מפרסמת את Grok 3 כ"מודל ה-AI החכם בעולם".
איגור בבושקין, אחד ממייסדי xAI, טען מנגד כי OpenAI עצמה פרסמה בעבר השוואות מטעות בין המודלים שלה. זאת בזמן שחוקרי AI הדגישו כי נתוני הביצועים הללו אינם מספקים תמונה מלאה, שכן הם אינם חושפים את עלויות החישוב והמשאבים שהוקצו לכל מודל.
הכתבות החמות
תגובות לכתבה(0):
תגובתך התקבלה ותפורסם בכפוף למדיניות המערכת.
תודה.
לתגובה חדשה
תודה.
לתגובה חדשה
תגובתך לא נשלחה בשל בעיית תקשורת, אנא נסה שנית.
חזור לתגובה
חזור לתגובה