אנליסטים ממאדים, מנהלי מוצר מנוגה
The podcast is in Hebrew, as we felt this topic deserves a deeper conversation within the Israeli tech community :-)
This podcast explores the world of Generative AI products and what it really takes to make them reliable in real life.
Reut Amir (Head of Product, Wix Customer Care) and Ariel Yaakobi (Head of Business Analytics, Wix Customer Care) share insights from hands-on experience evaluating GenAI products at scale. The wins, the mistakes, and the methods that actually worked for us.
We explained why evaluation is one of the hardest parts of GenAI development cycle, why traditional metrics fall short, and how to measure not just whether the AI is correct, but whether it’s helpful.
The podcast is designed to help product managers, analysts, and teams take their first steps into doing GenAI evaluation themselves, with practical guidance, examples, and a real-world perspective. Enjoy :-)
Episodes
5 episodes
שופט, לא רק יוצר: מודל השפה בתפקיד נוסף - חלק ב
כבר ידוע ומוכח שודלי שפה מצוינים בלייצר טקסט. אבל בעולם מוצרי ג׳נרטיב איי.אי, הם משמשים גם כשופטים.בפרק הזה אנחנו צוללים לעולם של LLM as a Judgeהגישה שבה מודלי שפה משמשים להערכת האיכות של...
שופט, לא רק יוצר: מודל השפה בתפקיד נוסף - חלק א
כבר ידוע ומוכח שודלי שפה מצוינים בלייצר טקסט. אבל בעולם מוצרי ג׳נרטיב איי.אי, הם משמשים גם כשופטים.בפרק הזה אנחנו צוללים לעולם של LLM as a Judgeהגישה שבה מודלי שפה משמשים להערכת האיכות של...
לפרק כדי לחזק: Error Analysis למוצרי Gen-AI
בפרק השלישי אנחנו צוללים אל אחת הפרקטיקות החשובות ביותר בעולם האבלואציה - Error Analysis. אחרי שבפרקים הקודמים דיברנו על מהי אבלואציה ולמה חשוב להתחיל מאבלואציה ידנית, הפעם אנחנו מראים איך משתמשים בתוצאות האלה כדי להבין מה לא עובד...