דיגיטל וטק

ChatGPT מול Grok של מאסק: מי חשוד בניפוח נתונים?

עובד ב-OpenAI מאשים את xAI בניפוח נתוני השוואות הביצועים של מודל Grok 3 ביחס ל-ChatGPT, מה שעלול להטעות משתמשים. האם החברה של מאסק באמת ניפחה נתונים, או שזו פשוט עוד שיטה להצגת נתונים?

רפאל בן זקרי | 23/2/2025 19:22

חברת הבינה המלאכותית xAI של אילון מאסק מואשמת בעיוות נתוני ביצועים של מודל הבינה המלאכותית החדש שלה, Grok 3, כך שהמשתמשים קיבלו רושם מוטעה מהשיגי המודל החדש. עובד של המתחרה OpenAI טוען כי xAI השמיטה נתון חשוב בהשוואה מול מודלים של OpenAI, מה שעלול ליצור רושם שגוי על ביצועי המודל.

xAI פרסמה גרף שבו מוצגים ביצועי Grok 3 Reasoning Beta ו-Grok 3 mini Reasoning במבחן AIME 2025, מבחן מתמטי תחרותי המשמש לעיתים כאומדן ליכולות AI. הגרף הציג את Grok 3 כעוקף את o3-mini-high של OpenAI, אך אנשי OpenAI מיהרו לציין כי הנתון שהושמט מההשוואה הוא cons@64 - מדד שמעניק למודל 64 ניסיונות לכל שאלה, ובוחר בתשובה הנפוצה ביותר. שילוב נתון זה עשוי לשנות את התוצאות באופן משמעותי. בהשוואה לנתון @1 (הניסיון הראשון של כל מודל לענות על השאלות), Grok 3 אכן מפגר מאחורי o3-mini-high של OpenAI ואף נותר מעט מאחור ביחס לדגם o1 medium. למרות זאת, xAI מפרסמת את Grok 3 כ"מודל ה-AI החכם בעולם".

איגור בבושקין, אחד ממייסדי xAI, טען מנגד כי OpenAI עצמה פרסמה בעבר השוואות מטעות בין המודלים שלה. זאת בזמן שחוקרי AI הדגישו כי נתוני הביצועים הללו אינם מספקים תמונה מלאה, שכן הם אינם חושפים את עלויות החישוב והמשאבים שהוקצו לכל מודל.

הכתבות החמות

רמי לוי, צילום: פלאש 90/ תומר נויברג, יוסי אלוני, shutterstock

תגובתך התקבלה ותפורסם בכפוף למדיניות המערכת.
תודה.
לתגובה חדשה

תגובתך לא נשלחה בשל בעיית תקשורת, אנא נסה שנית.
חזור לתגובה

ת"א
העולם
מט"ח
קריפטו

ת"א 125

2,455.120

2.13%

ת"א 35

2,417.670

1.94%

ת"א 90

2,622.600

2.63%

ת"א SME60

878.850

3.5%

ת"א נדל"ן

1,082.100

1.85%

תל בונד 20

392.820

0.31%

אירופה
ארה"ב
אסיה

DAX 40

20,374.100

-0.917%

FTSE 100

7,964.180

0.643%

CAC 40

7,104.800

-0.298%

יורוסטוקס 50

4,787.230

-0.658%

S&P 500

5,367.23

1.88%

נאסד"ק 100

18,661.4,707

1.73%

דאו ג'ונס

40,277.95

1.73%

VIX

39.18

-3.78%

ניקיי 225

33,585.578

-2.957%

האנג סנג

36.200

-3.723%

שנחאי

3,238.227

0.453%

דולר ארה"ב

3.708 ₪ / $

-1.183%

אירו

4.208 ₪ / €

0.200%

לירה שטרלינג

4.846 ₪ / £

-0.364%

פרנק שוויצרי

4.562 ₪ / ₣

-0.024%

100 יין יפני

2.590 ₪ / ¥

-0.473%

דולר קנדי

2.680 ₪ / $

-0.286%

ביטקוין

83,890.16

5.004%

את'ריום

1,573.00

2.834%

בינאנס קוין

588.98

2.291%

לייטקוין

76.89

4.826%

קרדנו

0.63

4.027%

אקס.אר.פי

2.05

2.893%

דוג'קוין

0.16

3.691%

ביטקוין קאש

312.20

6.772%

פולקה דוט

3.58

3.204%

מניות בולטות בת"א

מניות

עולות
יורדות
פעילות
ללא שינוי

שמיים

147.2

16.09%

מיטרוניקס

420

13.21%

פסגות קבוצה

38.9

12.1%

אלוט

2,026

11.2%

אלקטריאון

8,142

10.93%

קנבוטק

428.3

-28.69%

אקוואריוס מנוע

209.5

-6.76%

אפסלון ברנדס

55.6

-4.96%

נור

570.2

-4.14%

סילבר קסטל

334.2

-3.91%

פועלים

5,012

1.77%

אלביט מערכות

146,960

2.48%

טבע

5,009

דיסקונט א

2,552

1.43%

מזרחי טפחות

16,850

2.31%

טבע

5,009

ביג

52,720

סייברוואן

סיפיה וויז'ן

34.3

כן פייט ביופרמה

1.8

דעות

שר האוצר לשעבר: "תקציב המדינה – אנטיתזה לתקציב אחראי"

מאיר שטרית

בירת ה-AI של ישראל: העיר שמובילה את מהפכת הבינה המלאכותית

כרמל שאמה הכהן, ראש עיריית רמת גן

יו"ר ויצו, אניטה פרידמן, צילום: ניר סלקמן באדיבות ויצו

תקציב המדינה: לבלות כמו עשיר, ללמוד כמו עני

אניטה פרידמן, יו"ר ויצו

הנבחרת

סעו לביג גלילות בשבת והעבירו מסר: מתנגדים לכפייה הדתית | יריב אופנהיימר

יריב אופנהיימר

סמוטריץ' ונתניהו מתעלמים מכל מה שחשוב: תקציב המדינה הוא חרפה | פרופ' ירון זליכה

פרופ' ירון זליכה

אזהרת מוד'יס היא רק כרטיס צהוב, אבל סמוטריץ' לא יעצור גם באדום | עמית תומר

עמית תומר

עוד בנבחרת >>

24/7 | כל הכותרות

כתבות נוספות

ChatGPT מול Grok של מאסק: מי חשוד בניפוח נתונים?

הכתבות החמות

רמי לוי מסתבך עם הלקוחה: ''יצאנו פגועים, מושפלים והמומים''

הסוף למזומן בכספומטים בישראל? זו ההפתעה הגדולה לפני החג

מותג הטיפוח הפופולרי בישראל יורד מהמדפים: ''עלול להזיק לבריאות הציבור''

ביטוח לאומי בבשורה חשובה: זה מה שיקרה מה-13.4 בישראל

יעל בר זוהר וגיא זוארץ מודים: ''לא נוכל לחזור להיות מי שאנחנו''

אייל גולן ודניאל גרינברג חוגגים יום מאושר: ''הכי חזק ואיכותי שיש''