מי אמר AI - בינה מלאכותית ואנחנו

עם איזה מודל כדאי לעבוד? | פרק 37 ג'מיני 3 או צ'אטג'יפיטי 5.1

Eran Goldstein Season 1 Episode 37


הקרב הגדול: Gemini 3 Pro נגד ChatGPT 5.1 – מבחן השטח שיגרום לכם לשקול מחדש את המנוי שלכם

השבוע קרה משהו דרמטי בעולם ה-AI: גוגל הנחיתה את Gemini 3 Pro היישר לתוך ה-AI Studio, ובמקביל OpenAI שחררה עדכון שקט אך משמעותי ל-ChatGPT 5.1. במקום להסתפק בהודעות לעיתונות, החלטנו לקחת את שני המודלים המובילים בעולם לזירת אגרוף של 13 סיבובים אכזריים, כדי לבדוק מי מהם באמת מספק את הסחורה בחיים האמיתיים.

בפרק הזה אנחנו שמים בצד את הגרפים והבנצ'מרקים הטכניים ובודקים את המודלים במשימות שכולנו פוגשים ביום-יום. התוצאות היו חד-משמעיות והוכיחו שיש מלך חדש בשכונה.

מה בדקנו בין השאר?

מבחן הניואנסים הישראלי: ביקשנו מהם לנסח הודעת התנצלות "פולנית" לוואטסאפ של הגן. מי הצליח לייצר רגש ומי נשמע כמו רובוט מוגזם?

מבחן הראייה ("Vision") והתרבות: העלינו תמונה מתוך "קופה ראשית" עם הכיתוב "סחיטה בזיופים". בעוד מודל אחד גמגם ולא זיהה, המודל השני זיהה את קרן מור, ניב סוויסה ואפילו את ההקשר של הסצנה.

אינטליגנציה רגשית ושמיעה: נתנו למודלים להקשיב להקלטה של בוס שאומר "כל הכבוד" בטון סרקסטי ועוקצני. רק אחד מהם הבין שהבוס בעצם כועס, בעוד השני חשב שמדובר במחמאה.

לוגיקה והסקת מסקנות: אתגרנו אותם בשאלות היגיון מורכבות (חישוב אותיות בתוך שמות תוך כדי פעולות חשבון) ובדילמות עסקיות. התשובות חשפו הבדל עצום ביכולת "לחשוב" לפני שעונים.

מבחן המוסר: ביקשנו רעיונות לסטארטאפ שמקליט עובדים בסתר. התגובה של אחד המודלים הייתה מפתיעה מאוד (ולא לטובה), בעוד השני הציב גבולות ברורים.

האזינו לקרב הענקים שיעשה לכם סדר בארגז הכלים.

להרצאות, שאלות ומבחנים

eran@binali.co.il

הקורס שלנו

קורס יישומי AI בארגון