דיגיטל וטק

חוקרי הסייבר חשפו: הפרצה שמאפשרת ל-AI ליצור תוכן מזיק

חוקרי סייבר חשפו שיטה מתוחכמת לניצול מודלי שפה ליצירת תוכן מזיק, עם הצלחה של מעל 70%. האם כלי הבינה המלאכותית עומדים בפני אתגר חסר תקדים?

רפאל בן זקרי | 13/1/2025 6:40

אנדרואיד ובינה מלאכותית (צילום shutterstock)

חוקרי אבטחת סייבר מפאלו אלטו נטוורקס (Palo Alto Networks Unit 42) חשפו שיטה חדשה לפריצת מודלי שפה גדולים (LLMs), שמנצלת את יכולות ההערכה של המודלים עצמם לשם יצירת תוכן מזיק. השיטה, שנקראת Bad Likert Judge, הובילה לעלייה של למעלה מ-60% בשיעור ההצלחה של ניסיונות פריצה בהשוואה להתקפות ישירות ופשוטות.

במהלך הניסוי, החוקרים השתמשו בסולם דמוי ליקרט(Likert scale) כדי לבקש מהמודל להעריך את מידת הפגיעות של תוכן מסוים. לדוגמה, הם הנחו את המודל לדרג תוכן עם ציון 1 אם אינו מכיל מידע על יצירת נוזקות, וציון 2 אם הוא כולל מידע מפורט ליצירת נוזקות או קוד מזיק. לאחר שלב הדירוג, החוקרים ביקשו מהמודל לספק דוגמאות לתכנים שיתאימו לציונים 1 ו-2. בשלב הזה, המודל נדרש לייצר דוגמאות שממחישות את הדירוג, ולעיתים כלל גם תוכן מזיק כחלק מההסבר.

החוקרים גילו שבאמצעות הוספת שלבים נוספים לאחר בקשת הדוגמאות, ניתן לגרום למודל להרחיב ולהוסיף פרטים נוספים לדוגמאות המזיקות. בניסויים שבוצעו על פני 1,440 מקרים, תוך שימוש בשישה מודלים מתקדמים שונים, שיעור ההצלחה הממוצע של שיטת ה-Bad Likert Judge עמד על כ-71.6%.

הכתבות החמות

תגובתך התקבלה ותפורסם בכפוף למדיניות המערכת.
תודה.
לתגובה חדשה

תגובתך לא נשלחה בשל בעיית תקשורת, אנא נסה שנית.
חזור לתגובה

ת"א
העולם
מט"ח
קריפטו

ת"א 125

2,481.330

-0.85%

ת"א 35

2,448.470

-0.62%

ת"א 90

2,630.670

-1.39%

ת"א SME60

887.770

-1.72%

ת"א נדל"ן

1,078.660

-0.1%

תל בונד 20

399.570

0.19%

אירופה
ארה"ב
אסיה

DAX 40

20,641.721

-4.953%

FTSE 100

8,055.000

-4.952%

CAC 40

7,274.950

-4.264%

יורוסטוקס 50

4,878.310

-4.595%

S&P 500

5,074.0,801

-5.97%

נאסד"ק 100

17,397.6,992

-6.07%

דאו ג'ונס

38,314.86

-5.50%

VIX

45.31

50.93%

ניקיי 225

33,780.578

-2.750%

האנג סנג

36.800

-4.663%

שנחאי

3,342.008

-0.242%

דולר ארה"ב

3.743 ₪ / $

-0.005%

אירו

4.100 ₪ / €

0.090%

לירה שטרלינג

4.822 ₪ / £

0.052%

פרנק שוויצרי

4.349 ₪ / ₣

0.128%

100 יין יפני

2.549 ₪ / ¥

-0.041%

דולר קנדי

2.631 ₪ / $

-0.016%

ביטקוין

82,733.98

-0.940%

את'ריום

1,784.45

-0.915%

בינאנס קוין

592.68

-0.440%

לייטקוין

82.12

-2.122%

קרדנו

0.65

-1.502%

אקס.אר.פי

2.12

-0.127%

דוג'קוין

0.17

-1.368%

ביטקוין קאש

297.60

-0.268%

פולקה דוט

3.91

-3.575%

מניות בולטות בת"א

מניות

עולות
יורדות
פעילות
ללא שינוי

שמיים

137.3

8.03%

ליברה

1,369

6.7%

גאון קבוצה

490

6.48%

נקסטפרם

93.2

6.39%

קנבוטק

499.4

5.43%

ברק בית השקעות

5,481

-15.7%

הייקון מערכות

4.1

-14.58%

ביונ תלת מימד

15.4

-13.48%

טופ גאם

760

-9.71%

לייבפרסון

276.7

-9.46%

פועלים

5,115

0.81%

אלביט מערכות

145,340

1.07%

נייס

56,070

-2.32%

מזרחי טפחות

17,170

0.76%

דיסקונט א

2,620

-0.61%

שטראוס

8,000

בזן

91.4

לוינשטין הנדסה

38,000

מהדרין

23,440

ביוליין

1.8

דעות

הפקרת עשרות אלפי צעירים, משפחות וקהילות: הטעות שתעלה לכולנו ביוקר

ח"כ סימון דוידסון, סגן יו"ר הכנסת

לשלם גם על מסטיק באשראי: החוק שעושה סוף לכפייה הצרכנית

ח"כ אליהו ברוכי

הבעיה שמרחיקה התחדשות עירונית מהפריפריה – והפתרון שנמצא על השולחן

רועי לוי, ראש עיריית נשר

הנבחרת

סעו לביג גלילות בשבת והעבירו מסר: מתנגדים לכפייה הדתית | יריב אופנהיימר

יריב אופנהיימר

סמוטריץ' ונתניהו מתעלמים מכל מה שחשוב: תקציב המדינה הוא חרפה | פרופ' ירון זליכה

פרופ' ירון זליכה

אזהרת מוד'יס היא רק כרטיס צהוב, אבל סמוטריץ' לא יעצור גם באדום | עמית תומר

עמית תומר

עוד בנבחרת >>

24/7 | כל הכותרות

כתבות נוספות

חוקרי הסייבר חשפו: הפרצה שמאפשרת ל-AI ליצור תוכן מזיק

הכתבות החמות

בנק מזרחי טפחות מזהיר: כך טראמפ ישפיע על שוק העבודה

רשת המלונות הישראלית משתלטת על העולם: 23 בתי מלון בדרך

ביטוח לאומי מחלק מענק לפני פסח: מי הזכאים לקבל ב-8.4?

השכר הנמוך בישראל נחשף: זה המקצוע הכי פחות רווחי

אופירה אסייג וחיים לוינסון מתנצלים בשידור חי: ''קיבלנו תגובות רבות''

מיכל הקטנה חוגגת יום מאושר: ''אהבה שלי, מרגישה אותך בכל יום''