מנועים בינתיים

» «

מהו מודל היגיון, או Reasoning Model?

מודל היגיון (Reasoning Model) הוא מודל שחושב לפני שהוא עונה. הוא נקרא גם מודל ריזונינג או מודל חשיבה ודרך פעולתו היא של שרשרת חשיבה.

מודל המחשבה הזה פועל בדומה למודלי שפה רגילים, אך בניגוד להם - הוא אינו עונה מיד, ללא תכנון ומהר כמוהם, אלא להיפך - הוא איטי, מחושב ומסודר.

במקום מהר ולא תמיד מדויק, מודל המחשבה מחקה את תהליך החשיבה האנושית וכדי להגיע לתוצאות מצוינות הוא לוקח את הזמן ועובד לאט. הוא מפרק את החשיבה שלו לחלקים, כשלכל חלק כזה הוא מקדיש זמן ותשומת לב ורק אחרי שהוא מסיים אותו, הוא ממשיך לחלק הבא.

בשיטה זו, שזכתה לשם "שרשרת מחשבה", הוא מסוגל להסיק מסקנות לוגיות, באמצעות הסקה רב-שלבית ועל בסיס מידע נתון.

והתוצאות שלו? - הן מדויקות, איכותיות ועמוקות מאלה של מודלי שפה "רגילים".

למודל ריזונינג יש יכולת חשיבה מתמשכת ומבוססת יותר מזו של מודלי שפה רגילים. כי בשביל לענות על שאלות, מודלי ריזונינג (היגיון) כאלו "חושבים" ומשתמשים בהיסק רב-שלבי, בצעדים ובחשיבה מורכבת, מרובת שלבים ומעמיקה.

מכאן זכו מודלי היגיון לכינוי "שרשרת חשיבה" או "שרשרת מחשבה". הם חושבים כבני-אדם.

כך לדוגמה, אם נשאל מודל היגיון כזה כמה מוציאים הנהגים בישראל על דלק בשנה, המודל יפרק את השאלה לשלבים שאותם היה מבצע חוקר בדרכו לענות על השאלה הזו. בשלב הראשון המודל "יברר" כמה מכוניות יש בארץ, אחר-כך כמה דלק צורכת מכונית בממוצע, כמה עולה ליטר דלק בממוצע שנתי, כמה יעלה הדלק למכונית בודדת בשנה, הכפלת העלות השנתית כפול מספר המכוניות בישראל וכן הלאה.

כדי לנתח נתונים, לזהות דפוסים ולהסיק מסקנות מבוססות עובדות, מודלי היגיון נוטים להשתמש בטכניקות מורכבות הרבה יותר של בינה מלאכותית ולמידת מכונה. כל אלה מגדילים את היכולת שלהם לנתח נתונים, לזהות דפוסים ולהסיק מסקנות מבוססות עובדות.

בדרך לתת תשובה מחלקים מודלי הגיון את פתרון הבעיה לשלבים, מתעכבים על התשובות, מהרהרים, בודקים, לעתים מתקנים את עצמם (במשימות תכנות וקוד רואים זאת היטב) ומבצעים תהליכי ניתוח מורכבים.

מודל הגיון שכזה מתאים מאוד לפתרון ברמת דוקטור (PhD) של בעיות מורכבות, בעיקר מתמטיות, מדעיות והנדסיות. הוא מושלם לחישובים מורכבים ודברים כמו מתמטיקה, פיזיקה, פיתוח קוד והסקת מסקנות.

#המחיר
מבחינה טכנית, יש צורך בטכנולוגיה משוכללת ויקרה בהרבה ל"חשיבה" כזו ולתחכום הגדול בהרבה של המודלים הללו. כדי להתמודד עם משימות מורכבות הרבה יותר, נדרשים להם משאבי מחשוב וטכנולוגיה גדולים ויקרים בהרבה מהרגיל, מה עוד שהצורך לספק תובנות עמוקות הופך אותם כבדים ואיטיים יותר, עד שניתנים למשתמש התשובה והדרך בה המודל הגיע אליה.

על כוח המחשוב המשמעותי מהרגיל שדורשים מודלי ריזונינג, הדגים כבר מהתחלה המודל הראשון מסוג זה, ChatGPT 4o1 של OpenAI. זה ניכר מעט פחות, אבל עדיין, גם במודל הסיני המפתיע DeepSeek, שפותח לכאורה בגרושים והראה תוצאות היגיון ומענה מרשימות, כל אלה בדרישות חומרה נמוכות בהרבה.

#החשיבה דרך הבעיה
מודל היגיון, הוא מודל מנומק, שמשתמש בהיגיון כדי "לחשוב דרך" הבעיה ולהיות מסוגל גם להראות את תהליך החשיבה שביצע, לפני שנותן את התוצאות. זאת בניגוד למודלים הרגילים שמבצעים אופטימיזציה סבירה, רק כדי שיוכלו לספק את התשובה המהירה ביותר (שזה מה שגם גורם לא פעם למודל שפה רגיל לתרום לנו בדרך את ה"הזיות", אותן Halucinations המוכרות לנו כל כך).

בקיצור, אם מודל שפה רגיל הוא הבחור הטקסטואלי שהוא אלוף על טקסטים ועונה מהר, מודל ההיגיון הוא הנערה המבריקה והריאלית, שיכולה לפצח בעיות מופשטות, מתמטיות, פיזיקליות ומדעיות בתחומים ומדעים מדויקים, בלי למצמץ ועם יכולת לנמק ולהסביר את הפתרון שאליו היא מגיעה, צעד אחר צעד.

מודל כזה מבצע לעתים קרובות "שרשרת מחשבה" (Chain of Thought) ולכן גם מכונה כך לפעמים. המודל חושב צעד אחר צעד, בצורה שמזכירה את האופן שבו אנו, בני האדם, עשויים לגשת לאתגר משמעותי יותר כמו פיתוח אפליקציה חדשה, תכנון חופשה או בניית בית.

#היתרון
משמעותו של מודל כזה היא ביכולת שלו לספק תשובות מדויקות ומושכלות לשאלות מורכבות, לפתור בעיות ולקבל החלטות מבוססות נתונים. לכן וכדי להצטיין בבעיות מסובכות יותר, מומלץ להזין אותו בכמה שיותר הקשר, קונטקסט (Context) לגבי הנושא והגישה לפתרון.

#במה הם יכולים לעזור לנו?
מודלי ההיגיון מצטיינים בתחומים או משימות הדורשים יכולת חישובית גבוהה או דיוק. משימות כמו ניתוח מסמכים, ניתוח קבצים, או כתיבת קוד למשל, הן קלאסיות למודלים כאלה.

מודלי ריזונינג יכולים לנתח כמויות גדולות של נתונים במהירות ובדייקנות, לזהות דפוסים ולהסיק מסקנות. הם יכולים לפתור בעיות מורכבות יחסית, על ידי שימוש בלוגיקה ובאלגוריתמים מתקדמים.

ביכולתם גם לסייע בקבלת החלטות מבוססות נתונים, מה שיכול להיות מועיל בתחומים כמו רפואה, כלכלה וניהול. בנוסף, הם יכולים להסיק מסקנות לוגיות על בסיס הנתונים שנתונים להם, מה שיכול לסייע בתחזיות ובתכנון.

מודלי ההיגיון יכולים לחסוך זמן ומאמץ בביצוע משימות מורכבות, מה שמאפשר למשתמשים להתמקד בפעילויות אחרות. ביכולתם לספק תשובות מדויקות ומבוססות עובדות, מה שיכול להיות מועיל בתחומים כמו רפואה, משפטים והנדסה.

מודלים אלו מסייעים בקלות בקבלת החלטות מושכלות ומבוססות נתונים, מה שיכול להיות מועיל בחיי היומיום ובעבודה והם יכולים גם לסייע בפתרון בעיות מורכבות במהירות וביעילות, מה שיכול להיות מועיל בתחומים רבים.

ברפואה, מודלי היגיון יכולים לסייע באבחון מחלות ובמתן המלצות לטיפול על בסיס נתונים רפואיים.

בכלכלה, ניתן להסתייע בהם בניתוח שוק ההשקעות ובקבלת החלטות כלכליות מבוססות נתונים.

בחינוך, המודלים הללו יכולים לסייע בהוראה ובלמידה על ידי סיפוק הסברים מדויקים ומושכלים לשאלות מורכבות.

בניהול, הם מעולים הסיוע לניהול משאבים מוצלח ובקבלת החלטות ניהוליות מבוססות נתונים.

אז אם לסכם, מודלי חשיבה, מודלי מחשבה, מודלי חשיבה, או מודלי היגיון הם כלים חזקים שיכולים לסייע במגוון רחב של תחומים ולשפר את איכות החיים של המשתמשים. הם עושים זאת על ידי סיפוק תשובות מדויקות ומבוססות עובדות. עם יכולות כאלה מודל מחשבה מאפשר לנתח נתונים במהירות, לפתור בעיות מורכבות ולקבל החלטות מבוססות נתונים, מה שהופך אותו לאחד הכלים החיוניים ביותר בדור החדש של העידן הדיגיטלי מבוסס הבינה המלאכותית.

הנה מודל הריזונינג, מודל המחשבה שחושב לפני שהוא עונה (עברית):

https://youtu.be/inQWCxyBWJY

מודל ההגיון הסיני Deepseek R1 שיודע לחשוב מראש, לתכנן, להשוות כמה תשובות אפשריות, לפרק את הבעיה לחלקים, לחזור אחורה ולחשוב מחדש על השאלה וכך לענות היטב על שאלות קשות, מורכבות ועד לא מזמן בלתי אפשריות למודל שפה:

https://youtu.be/-2k1rcRzsLA

דוגמה לבעיות פשוטות מהחיים שמודל מנומק יכול לפתור:

https://youtu.be/yQampjl6gPI

שניים כאלה:

https://youtu.be/rzMEieMXYFA

ו-DeepSeek R1 הוא מודל מנומק בקוד פתוח:

https://youtu.be/yT3KGbiA09Q

מהם מנועי תמונות ובינה ויזואלית ב-AI?

הבינה המלאכותית היצירתית (GenAI) כמו DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.

הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצרת AI, לציירת, צלמת ועוד כל מיני סוגי אמנים - אבל במקרה שלה - תמיד באינטליגנציה מלאכותית.

באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימי-בייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ואפילו מדהימים.

ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.

להישג המקורי של DALL-E קמו די מהר מתחרים איכותיים לא פחות ואף יותר. הם מציעים עולם חדש וחסר תקדים של ציירים בינתיים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.

איש לא יודע בדיוק כיצד המנועים השונים פועלים, אבל זו עבודה מדהימה של למידה עמוקה שמעבדת בעצמה את הדאטה ממיליוני תמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.

התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית ותחרות של חברות ומפתחי קוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין. השטח מלא במודלים שבראשם מידג'רני, אידיאוגרם ו-Flux, המודל בקוד פותח שמייצר תוצרים שומטי לסתות.

מחפשים ליצור סגנונות של ציורים? - ראו בתגית "כלי איי, תמונות, סגנונות".

הנה כלי Gen AI מצטיין בשם ideogram ליצירה ויזואלית:

https://youtu.be/XZjaHJP0PQE

באיזה כלי לבחור לכל צורך? (עברית)

https://youtu.be/a5wUS6SQ0us?t=1m47s

"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:

https://youtu.be/qTgPSKKjfVg

על היכולת המופלאה של דאלי ליצור אמנות:

https://youtu.be/hiSgpZUAy2c

הסבר אמנות ה-AI:

https://youtu.be/alJdw4JDJ4o

מנועי יצירת תמונות מתחרים:

https://youtu.be/rGbNJrywLhk

גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):

https://youtu.be/KR29znIp2LU

ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:

https://youtu.be/G-Wsh1vUeVQ

קבלו משפר פרומפטים ליצירת תמונות (עברית):

https://youtu.be/HLhRFaXQ0vQ

מדריך להרחבת תמונות:

https://youtu.be/V1KLG159A2s

קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:

https://youtu.be/VR3AWdyVVdU

למה יש לבינה כל הזמן בעיה עם אצבעות?

https://youtu.be/24yjRbBah3w

גם למחוללי תמונות מעולים כמו מידג'רני יש בעיות (עברית):

https://youtu.be/xUpUhHsAWlg?long=yes

הסבר מעמיק וארוך על יצירת תמונות גנרטיבית (עברית):

https://youtu.be/aHPFq-Q6JQ0?long=yes

ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:

https://youtu.be/FRClNMC_z-s?long=yes

מהו הפרומפט בעולם הבינה היוצרת הגנרטיבית?

מהו המקביל של מברשת הציור של ציירים, כלי הנגינה של המלחין או העט והמקלדת של הסופר או המשורר?

בעולם הבינה המלאכותית הגנרטיבית זהו הפרומפט (Prompt), ההוראה הכתובה, הנחייה טקסטואלית שאנחנו כותבים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו את התוצר שאנו רוצים.

בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצאה שנרצה לקבל מהבינה. עליו מתבסס כבר הגל החדש של פיתוח תוכנה, זה שזכה לכינוי "קידוד אווירה", בלועזית וייב קודינג (Vibe Coding), אבל ביצירת תמונות, שירים או סרטוני וידאו הוא כבר מזמן כלי עבודה לכל דבר.

הפרומפט של ימינו הוא כבר מזמן המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.

זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.

#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט כדי ליצור משהו, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate) - היא זו שבמידה רבה תקבע את האיכות של התוצרים.

יש אפילו מקצוע חדש שמזנק בעולם ה-AI. הוא נקרא "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.

#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:

פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:

ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח.

אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, אם יש דברים שלא תרצו הרי שתוכלו להציב גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".

שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה.

זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.

בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אגב, אפילו פיסוק יקבע את התוצאה - מסתבר

ששימוש בסימני פיסוק יגרום לבינה המלאכותית להישמע מלוטשת, מובנית ופורמלית יותר והיא אף מתרחקת בתשובה כדי לתת תמונה רחבה יותר של הנושא, בעוד שללא פיסוק, הטון של התוצר יהיה שיחתי יותר, משוחרר יותר ולעתים קרובות יותר מעשי ורגשי. בקיצור - יותר צעיר.

אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').

הסבר כמו למתחיל - בקשו בפרומפט כך:

"Explain [subject] in simple terms. Explain to me as if I'm a beginner."

כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):

https://youtu.be/joJVqKTPVsY

השיעור הראשון בניסוח הפרומפט:

https://youtu.be/Qos2rG3zVAM

איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):

https://youtu.be/zFS7WtovYmo

יש תוכנה לעזרה בניסוח פרומפטים (עברית):

https://youtu.be/HLhRFaXQ0vQ

על הפרומפט שמייצר חדשות קוליות לגיק (עברית):

https://youtu.be/5TlsXXTamBs

מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:

https://youtu.be/pZsJbYIFCCw

הנה מקצוע מהנדס הפרומפט:

https://youtu.be/Bq-ncjOGeVU

עצות וטיפים לפרומפטים ושיחות עם צ'טבוטים (עברית):

https://youtu.be/R4E_lc_2wtY?long=yes

והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:

https://youtu.be/hd7l9F3n4ZM?long=yes

אילו מקצועות ייפגעו מהבינה המלאכותית הגנרטיבית?

אנו בעידן הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer. הצ'ט בוט הזה מוביל שורה של פיתוחים דומים ולמעשה הוליד, כמעט יש מאין, עולם חדש של טכנולוגיות. יצירתיות, חדשניות ומדהימות.

העניין הזה כבר הוליד פועל חדש בעברית, כשהמערכות הללו מתחילות לג'נרט (מלשון generate), כלומר לייצר תוכן באופן אוטומטי על ידי מחשבים ומודלי שפה תבוניים, דוגמת ChatGPT, Claude, Gemini ודומיהם.

מודלי השפה הללו מתקדמים במהירות והמירוץ לפתחם ימשיך. במקביל לעבודה המדהימה שעושים המפתחים של O.AI יוצאים כל הזמן כלים מתחרים, כולל של ענקיות כמו גוגל, פייסבוק ואמזון, העובדות על מוצרים דומים.

ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.

אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך עליו ועל הידע והמידע שהיא מציע לנו בכל התחומים, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות. בעניינים אחרים המרוץ לבשלות ככל הנראה ימשיך והם יגיעו די מהר...

קשה אולי להאמין שהמקצועות שאנו מכירים ייעלמו לגמרי. וגם אלו שאכן ייעלמו - זה לא יקרה מיד, אבל זה תהליך שיימשך, תהליך בו מקצועות עבודה יהפכו יותר ויותר למקצועות של פיקוח על הבינה המלאכותית שעושה אותה.

כשהאדם מפקח על עבודת המכונה, הוא יצטרך להיות בתחום כדי להיכנס לפעולה כשהמכונה נתקלת בבעיה שהיא לא יודעת לפתור, לא מתפקדת, מתקלקלת וכדומה.

אז אילו סוגי מקצועות ייפגעו מהבינה? - ההערכה היא שבעיקר מדובר בעבודות הקשורות בשפה. כל מי שמשתמשים בעבודה שלהם בשפה, באופן ישיר ומשמעותי ולא הכרח ביכולות אחרות, פיזיות, ליטרלי שריריות, יכולים לשער שהבינה המלאכותית תוכל לבצע במעלה ההתפתחות שלה את מלאכתם.

עיתונאים, מידענים, תחקירנים, אנשי שיווק, פרסום ויוצרי תוכן, מתכנתים ואפילו מוסיקאים - אצל כולם השפה היא כלי מרכזי בו הם עושים שימוש בליבת שיטת העבודה. אז זה לא שלא יהיו עיתונאי-על, או מוסיקאים אנושיים - הם פשוט יהיו מעטים ומעולים. השאר ימצאו את עצמם מוקפים באנשים שאינם אנשי מקצוע, אך למדו לנצל כלי AI ולייצר תוצרים שייתחרו בשלהם.

גם אנשי מדיה צריכים לדעת שהמקצועות שלהם יעברו שינויים משמעותיים ולמעשה כבר עוברים. עורכי סרטים, צלמים, יוצרי סרטים, מקליטים, עובדי אולפנים, טכנאי סאונד, עורכי אפקטים ומעצבים גרפיים - המקצועות הללו כבר עוברים שינויים וכדאי שיתעדכנו בהם היטב כי כך יוכלו להשתנות עם התחום ולהתבגר לחידושי ה-AI שייכנסו אליו, למצוינות והובלה בו.

הנה השפעת הבינה המלאכותית על העולם האנושי שלנו (מתורגם):

https://youtu.be/RzkD_rTEBYs

יחליף את המורים? - למה בחינוך מודאגים ממודל השפה החדש?

https://youtu.be/Fn8jDanbf0c

האם הג'י פי טי יחליף למשל את הסופרים ויכתוב ספרים, כמו שהוא מייצר היום ספרי ילדים (עברית):

https://youtu.be/sDjFRAP0Szg

כך ה-AI מאיים דווקא על מקצועות הצווארון הלבן:

https://youtu.be/lxvIuoD-nOs?long=yes

ומה הוא עושה לתלמידים והמורים (עברית):

https://youtu.be/vmmUiyeGNB8?long=yes

איך מתכנתים בכלי וייב קודינג ללא מתכנתים?

כלי וייב קודינג (Vibe Coding), כמו Lovable או Base44, הם כלים מבוססי AI, ידידותיים ללא מתכנתים, נוחים ופשוטים לבניית אפליקציות ואתרים, שלא מחייבים ידע בקוד או בתכנות.

בניגוד לכלים כמו Windsurf או Cursor, שהם forks של VSCode ובעצם עובדים על IDE למתכנתים, בייס44 ולאבאבל יותר מתאימים למי שלא מתכנתים ביום יום שלהם ועדיין רוצים לפתח מוצרים שחלמו עליהם זמן רב. הם יהפכו רעיונות ליישומים פונקציונליים לחלוטין - ללא שורת קוד אחת.

ב-Base44 יש לכם תיבת פרומפט פשוטה, שבתוכה תוכלו לכתוב בפשטות את הרעיון שלכם ולצפות כיתד הוא מפותח בשבילכם. ככל שתדייקו ותנסחו לפרטי פרטים, בכל שפה שתרגישו שנכונה לכם, הוא יפתח כלי שיהיה יותר מדויק ותואם לחזון שלכם.

רושמים, לוחצים על הפעלה ו-Base44 המחומש בהרבה AI, ייתן עבודה מאחורי הקלעים ותוך זמן לא ארוך תראו את החלום מתממש. בפרומפט ניתן ואף מומלץ לפרט כמה שיותר את הפיצ'רים המרכזיים שתרצו, את תיאורי המבנה של האפליקציה או האתר, פלטת הצבעים שבה תרצו לעצב אותם, את הפונטים, האנימציות וכדומה.

לא קיבלתם מה שרציתם? הכלי לא הבין אתכם? רוצים לשפר? - בפרומפטים נוספים ניתן לערוך את התוכנית הזאת כמה שתרצו. פשוט הנחו אותו בפרומפטים נוספים של תיקונים, תוספות, שינויים או דיוקים. הוא יזרום וישדרג את התוצר, יתקן ויאפשר תכונות ופיצ'רים נוספים או משופרים - בהתאם לדרישותיכם.

ולבסוף, אם וכשאתם מרוצים, פשוט לחצו על publish והשיקו את הבייבי שלכם לעולם.

את Base44, למשל, פיתח היזם הישראלי מאור שלמה. בניגוד לסטארטאפ קודם שמינכ"ל וגייס עבורו מיליוני דולרים, כאן הוא פיתח לגמרי בעצמו, כ"חברה של איש אחד" ומפעיל שיווק ויראלי חכם, שחשף המונים לכלי וההתפעלות מהיכולות שלו עשו את שאר העבודה.

וכדי להוסיף לכל הטוב הזה גם אופק והתפתחות מתמדת, מאור מוסיף בלי הפסקה פיצ'רים נוספים שמאפשרים גם למתקדמים לעשות פרוייקטים מורכבים יותר באמצעות Base44, כמו הוספה של מאגרי מידע חיצוניים, חיבור של API מגוונים ועוד.

#להפעלת כלי מבוסס AI
שימו לב שאם תרצו שהאתר או האפליקציה הסופית יתבססו על יכולות של AI, תצטרכו מנוי לצ'טבוט כמו Chat GPT או Claude וממנו לקבל API שאותו תצטרכו להכניס במהלך הפיתוח של הכלי שלכם והוא שיאפשר הפעלת הכלי החדשני ומבוסס הבינה המלאכותית.

#מה תלמדו כאן?
המדריך הבא הוא מבוא מעשי שיספק לכם בסיס מצוין לתחילת העבודה עם Base44 החינמי. זה יקרה אחרי שתפתחו חשבון באמצעות חשבון הגוגל שלכם ותתחילו לייצר פרויקט קיים, עם אפשרויות כמו לינקים לרשתות חברתיות, לוגואים, תמיכה בעברית (RTL), תאימות מלאה, צפייה באנליטיקות, תצוגה רספונסיבית במובייל, שיתוף של פרויקטים, ייצוא קוד ל-GitHub והגדרות אבטחה.

בהמשך תכירו תכונות מתקדמות בסביבת הפיתוח, כולל ניהול משתמשים, שליטה על דרישת התחברות, הוספה של דומיינים, עבודה עם קבצים ותמונות ואינטגרציה עם שירותי תשלום כמו PayPal ו-Stripe.

בהמשך ילמד אתכם המדריך ניסוח פרומטים (prompts) שישפרו את האתר, כולל שליטה ביצירה של SEO מוצלח ותמיכה בעדכונים. כל זה תוך שהוא מדכיש פיצ'רים כמו שליטה על עמודים ושמירת גרסאות.

בחלק השני תבינו את הנגישות והפשטות, לצד השכלול והעוצמה של Base44 וכיצד הכל מתחבר לפיתוח וייב קודינג פשוט וחכם, של אתרים ואפליקציות מעולים.

כאן תלמדו כיצד להתחיל מאפס ולבנות אתר או אפליקציית רשת חדשה באמצעות Base44. מההתחלה במסך הבית, עם ניסוח הפרומט של הרעיון שלכם והפיצ'רים הרצויים, תבנו את הפרויקט שלכם על ידי הזנת ההנחיות, רשימת הפיצ'רים, הנחיות UI ו-UX, תוך הבנה ושימוש בפונקציית Deep Coding של בייס44, המשלבת מודלי AI של "שרשרת מחשבה" (Chain of Thoughts), ליצירת אפליקציה מתקדמת ויעילה.

תוסבר גם החשיבות של GitHub לניהול גרסאות קוד, כיצד חוזרים לגרסאות קודמות שלו ואיך מעבירים פרויקט למתכנת אחר. יוצגו דוגמאות לפרויקטי Base44 בתוך GitHub ויוצגו שיטות וטיפים לשימוש אופטימלי בפלטפורמה זו.

הנה היכרות עם Base 44 לפיתוח וייב קודינג (עברית):

https://youtu.be/luGJU_6jqR0?long=yes

סקירה והיכרות עם הכלי - שיעור 1 (עברית):

https://youtu.be/kMTPbQXbFuY

בניית אפליקציה חדשה - שיעור 2 (עברית):

https://youtu.be/OIa9_ztCbhQ

פונקציית Backend מחברת את האפליקציה ב-Base44 לשירותים חיצוניים ומרחיבה את הפונקציונליות שלה עם ממשקי API ואינטגרציות של צד שלישי:

https://youtu.be/5LHFT0K08ws

מדריך להגדרת אינטגרציה של Base44:

https://youtu.be/IBfdxAh7pNE

לעומק ה-Workspace - סביבת העבודה שבה ניתן לנהל הגדרות (settings), להגדיר פריסות (deployments), להזמין משתמשים ועוד:

https://youtu.be/Q_TtYcDyNWY

יתרונות וחסרונות של פלטפורמת Base44 (עברית):

https://youtu.be/VMM7i7ULpGI

השוואה בינו לבין כלים מתחרים (עברית):

https://youtu.be/QrBcYHlVSw0

השוואה שלו עם Lovable.dev (עברית):

https://youtu.be/FF2-sSM_e2Y

לקראת פיתוח ראשון - שפרו את החשיבה "כמו מתכנת" שלכם (עברית):

https://youtu.be/N8wFaVbWqTk?long=yes

המלצות של כל מיני כלים בבייס44 שתרצו לנצל (דוקומנטציה, דיסקורד, אינטגרציות ועוד):

https://youtu.be/apHv5oXpkpA

דוגמאות ליצירת יחידת לימוד לנושא ספציפי (עברית):

https://youtu.be/85bNh0hh9BU

דוגמה לפרומפט לבניית אתר:

https://youtu.be/VTaLBpbFndI?t=24

למוצר מורכב כדאי להיעזר ב-LLM כדי לנסח את הפרומפט ולתכנן את הכלי לפני שמגיעים לבייס44:

https://youtu.be/VhN2_IuY1eQ?t=44

וראיון עם מאור שלמה - מפתח הכלי (עברית):

https://youtu.be/sBOQSzYCKMI?long=yes

והכלי לעבודה עם כלי גוגל Google AI studio:

https://youtu.be/vAvs4lBqSFo?long=yes

מה עושים כלי מחקר ועיון מבוססי AI?

כלי מחקר מבוססי בינה מלאכותית ג'נרטיבית הם סוג של סוכני AI משוכללים (AI agents) המיועדים לחקר וארגון המידע שאנו צוברים בתהליך המחקרי.

מבין מודלי השפה הגדולים (LLMs) בולטים קלוד ו-Chatgpt שפותחו לכלים מולטי-מודאליים. ככאלה הם מתאפיינים ביכולת ללמוד דברים מטקסטים, תמונות, צילומי מסך ועוד ולשפר את הביצועים עם תוצאות בפלט הכולל טקסטים, קוד, אודיו, וידאו, תמונות והבנה מרחבית.

לצידם יש מודל שפה שהוא יותר מחקרי באופיו וכולל מנוע חיפוש. מדובר ב-Perplexity, כלי שהחל בהתבססות על דאטה מחקרי, בעיקר מ-Google Research. כשהפך להיות הצ'טבוט המחפש הראשון, הוא מתבסס על תוכן עדכני ורלוונטי שהוא מאתר באינטרנט בזמן אמת, עם עדיפות לתמציתיות ולנתוני אמת. בנוסף, פרפלקסיטי שומר על כללי הציטוט המדעי, נותן ציטוטים עם ציוני מקור, מנמק ומקשר את טיעוניו למקורות שעליהם התבסס ומהם שאב את המובאות והתשובות.

יש גם את NotebookLM של גוגל, מעין מחברת חכמה, משולבת במעין שותף ללמידה ומחקר, שמבין אתכם ועוזר להפיק את המרב מהחומר המחקרי או הלימודי.

וכך במקום לבזבז זמן על עבודה טכנית ומשעממת, ניתן להעלות אליו בהעתק-הדבק, קבצים מצורפים או לינקים - עשרות טקסטים, מאמרים, לינקים, כתבות וספרים וגם סרטוני יוטיוב והקלטות קוליות.

לאחר ש"מאכילים" אותו בחומרים, הכלי קורא, מבין ומנתח את כל המידע במהירות, כשיתרונו הגדול הן התשובות הישירות לשאלות, בלי שטויות או הזיות, כמו של המודלים שמוכנים להמציא חלקים בתשובה, רק כדי לומר לנו מה שאנו רוצים לשמוע.

וכך, במקום שנבזבז שעות על קריאת חומר וכתיבת סיכומים, NotebookLM מייצר בקלות סיכומים חכמים, תובנות, מדריכי למידה, צירי זמן ותשובות לכל שאלה. ניתן לצ'טט או ממש לשוחח עם המחברת כאילו היא עוזר אישי וקולי, לשאול שאלות שתרצו על החומר ולקבל תשובות מדויקות ומובנות.

מרשימה גם היכולת של NotebookLM, להפוך את הידע שטענתם אליו לפודקאסט, (כולל בעברית) וגם לשאול שאלות עם מיקרופון ולהיות שותפים מלאים לשיחה עם "המגישים". תארו לעצמכם שתוכלו לקחת את הסיכום שיהפוך להרצאה מוקלטת בקול אנושי לחלוטין, או לסרטון לימודי או מקצועי. זו למידה חווייתית, שיתופית ומעניינת הרבה יותר.

עוד כלי מחקר טובים הם עזרי כתיבת פרומפטים ומאגרי פרומפטים המסייעים לתקשורת יעילה עם מודלים גדולים של שפה. כלים כאלה הם חיוניים למגוון עצום של שימושים, כולל שלל אפשרויות מחקר, כתיבה והפקת תובנות מתוכן גולמי וממקורות בינתיים.

ברמה המדעית יש גם יש כלי בינתי, מעין מודל שפה גדול (LLM) בשם Consensus שהוא בעצם מנוע חיפוש אקדמי מבוסס בינה מלאכותית. הוא עצמו משתמש במודלי שפה גדולים (LLMs) כדי לאסוף, לנתח ולהנגיש מידע מדעי בצורה פשוטה ומדויקת. המנוע של "קונצנזוס" מנתח יותר מ-200 מיליון מאמרים מדעיים, מסכם אותם באופן תמציתי ומציג את הקונצנזוס המדעי, מה הדעה הכללית ביחס לשאלות מדעיות בנושאים שונים. לשם כך הוא משתמש בכלים כמו "Consensus Meter", בו רואים את התפלגות הדעות בשאלה המסוימת ולומדים על "מה חושב המדע" לגביה.

עוד שיטה שהוא נוקט היא "Pro Analysis". שימושיה העיקריים בחינוך ובמחקר הם בסיוע לסטודנטים ולמורים במציאת מאמרים רלוונטיים, יצירת סיכומים מותאמים לשואל, ניתוחים מהירים של ספרות מדעית, סינון מאמרים שלא עומדים בדרישות מדעיות מוגדרות (כמו מתודולוגיה, גודל מדגם או מובהקות סטטיסטית) והפקה של ציטוטים אוטומטיים ודוחות מותאמים.

הנה NotebookLM, כלי המחקר לטעינת חומרים מגוונים ומשימות עליהם (עברית):

https://youtu.be/_vML22ACIRs

הוא יכול לייצר אפילו פודקסט:

https://youtu.be/1jgpsGDUXW4

מחקר חזותי עם תמונת מסך או מצלמה ומורה פרטי בחינם:

https://youtu.be/j-llSb7zT3o?t=5m09s

הצ'טבוט שמצטיין במחקר ובחיפוש - Perplexity (עברית):

https://youtu.be/1MkBWfurQL4

כלי AI מקצועי למחקר מדעי בסקירת ספרות ולמידה ממאמרים:

https://youtu.be/LBzrVEG5qsk

מארינר - סוכן AI והעוזר הגלובלי של גוגל:

https://youtu.be/WJnUWldjJQA?long=yes

הבן של גוגל וקלוד - הנה פרפלקסיטי ששילב את שני העולמות (עברית):

https://youtu.be/33nBpKRWMms?long=yes

כמה כלי מחקר מבוססי AI:

https://youtu.be/Rc9R7T8S1c8?long=yes

ומדריך לעבודה עם NotebookLM:

https://youtu.be/UG0DP6nVnrc?long=yes

מה זה UBI שישמור בעתיד על מובטלי ה-AI?

מדובר ברעיון מסעיר ויצירתי. הוא נקרא "הכנסה בסיסית אוניברסלית" (Universal Basic Income בקיצור UBI) ובעזרתו יש מי שמנסים לקדם את פני הרעה של הקדמה הבינתית, המאיימת על כל עולם התעסוקה של העתיד.

כוונתו להעמיד לרשות כל אדם הכנסה בסיסית, שמטרתה לסייע בהפחתת ההשפעות של הטכנולוגיה על העובדים. הכנסה בסיסית כזו תחושב על ידי "חישוב בסיסי אוניברסלי" ודי אחיד.

הרעיון הוא להציע הכנסה בסיסית אוניברסלית, מעין תשלום מזומן, ללא תנאים, שיינתן לכל מבוגרי האוכלוסייה, ללא קשר לעושרם ולמצבם התעסוקתי. המטרה היא לספק רשת ביטחון לאנשים שהמשרות והתעסוקה שלהם מאוימות על ידי חידושי הטכנולוגיה, כולל ובמיוחד הרובוטיקה והבינה המלאכותית.

הכוונה היא לאפשר להם לחפש עבודה בתחומים שמדברים אליהם ומעניינים אותם, בדברים שיסייעו להם לממש את עצמם והם יכולים להצליח בהם, לבלוט ולנצנץ - אולי אפילו ליזום עסק משלהם וליצור לעצמם בסיס כלכלי מבלי להיות שכירים, באיום מתמיד של אבטלה...

גם אם שמרנים רבים נוטים לדחות את מה שהם תופסים כרווחה שתקטין את המוטיבציה של אנשים לחפש עבודה ולעבוד, ניסיונות לחלק UBI לתושבי ערים ומדינות בארצות הברית הראו תוצאות חיוביות בדרך כלל. חלק מהתוכניות הללו, אגב, העניקו את התשלומים באופן סלקטיבי לאנשים, על סמך הצורך המוכח או המעמד החברתי שלהם ולא לכל האוכלוסייה כולה.

בין התומכים ביוזמה הזו ניתן למצוא גם רבים מראשי ומצליחני ההייטק, כולל מי שמובילים את התפוצצות ה-AI הנוכחית, ביניהם מנכ"ל חברת OpenAI והאדם הכי חזק בעולם הבינה המלאכותית כרגע, סם אלטמן.

לשיטתו, דווקא בשל החשש שהבינה המלאכותית תלך ותחליף אינספור עובדים אנושיים, כולל אנשים שלמדו מקצועות ורכשו תארים ומומחיות ויהפכו למובטלים, אולי אפילו מובטלים כרוניים, דווקא בצל החשש הזה כדאי לתת את ההכנסה הבסיסית המדוברת.

לשיטתו של אלטמן, כל אזרח יקבל, אולי במקום כסף, חלק ממחשב סופר-מתקדם, שהוא מכנה לצורך העניין GPT-7. כל מקבל כזה, אלטמן גורס, יכול יהיה לעשות כרצונו בחלק שקיבל. יהיו מי שישתמשו בו ויקימו מיזם, למשל טכנולוגי, או יהיו שותפים במיזם כזה, אחרים ירצו אולי למכור את החלק שלהם לאחרים, יהיו שיעדיפו לתרום אותו לטובת מחקר בפתרון בעיות עולמיות, כמו משבר האקלים או חקר הסרטן.

ההנחה של מנכ"ל OpenAI היא שעם הטמעתה של הבינה המלאכותית המתקדמת ביותר ויותר היבטים של חיינו, הבעלות על יחידה של מודל שפה גדול, כזה שהוא מכנה GPT7, עשויה להיות בעלת ערך גדול יותר מאשר כסף. אלטמן רואה עולם בו כל אדם בחברה העתידית יחזיק למעשה חלק מהקידמה והיצרנות העתידית ויוכלו להבטיח לעצמם ולמשפחתם פרנסה בעתיד.

הנה רעיון ההכנסה הבסיסית אוניברסלית (עברית):

https://youtu.be/8rM_-49DPe4

בטלנות? רוגע כלכלי? - על ניסוי ראשון איך זה ישפיע על בני אדם? (עברית)

https://youtu.be/u_-N_AWQQiI

בעלי מקצוע מפחדים על העבודה שלהם (עברית):

https://youtu.be/0AGYOv0sGHg

וסרטון מקיף על ה-UBI ומשמעויותיו (מתורגם):

https://youtu.be/kl39KHS07Xc?long=yes

איך וייב קודינג מעביר את התכנות לשפה טבעית?

בימי AI אלה, של פברואר 2025, נראה שאנו רואים את השינוי בכתיבת קוד בכלל ובתכנות של אפליקציות לסוגיהן בפרט.

וזה לא ממש תכנות, עם כתיבת קוד וחלוקה למסמכים שיוצרים תוכנה, אלא יותר תהליך של חשיבה וחלוקת הוראות. כולנו יכולים לחשוב על רעיון, לנסח אותו כפרומפט, אולי גם לדמיין ולצייר מסכים, להציגם ל-AI, לראות קוד ואת התוצאה, לאשר או להציע תיקונים, לשפר את המודל ולראות את התוצאה משתפרת.

גם אם זה נשמע בלתי אפשרי, זה בדיוק מה שהבינה היוצרת מאפשרת כיום, כמעט לכל אחד, כולל מי שלא למדו מעולם לקודד ולתכנת. אחד מגאוני ה-AI של הדור החדש, אנדריי קרפאטי (Andrej Karpathy), מסביר שכלי ה-GenAI משנים את אופן פיתוח התוכנה מהיסוד וקורא לזה “תכנות וייב” (Vibe Coding).

תכנות הווייב פירושו תכנות שלא בקוד אלא של מפתחים שמתרכזים ברעיונות הגדולים ונותנים ל-AI לטפל בשאר - מהקוד והאיטרציות (שפירושן שיפור וניסוי שוב ושוב), דרך הפרטים הטכניים, הטיפול בבסיס הנתונים (Database), ב-API ובהעלאת הכלי לאונליין (Deployment).

ומדובר בשינוי של כל החוקים שהכרנו. המעבר הזה מכתיבת הקוד לפתרון בעיות באמצעות חשיבה מדויקת ככל האפשר, הנחיות ל-AI, עיצוב מסכים והעלאתם כטיוטות עיצוב לבינה, כל אלו הם חלום שמתממש. משמעותם הפשוטה היא דמוקרטיזציה של עולם פיתוח התוכנה.

והאפשרויות החדשות הללו מאפשרות עכשיו גם לאנשים ללא רקע תכנותי או היכרות והבנה בקוד, להגשים את רעיונותיהם - על ידי יצירה של תוכנות מקוונות, אפליקציות או כלים שונים, באמצעות כלים בינתיים וטכנולוגיים, המופעלים על ידי אדם ולידו בינה מלאכותית, שמקבלת ומבצעת הוראות.

אז המרחק, שבעבר היה גדול מאוד, בין הרעיון למימושו, תלוי עכשיו במשתמש ורק בו. כלים רבים לקידוד מבוסס פרומפטים יש כיום והם משתכללים מיום ליום. המוח האנושי יידע להנפיק מהם גם שיפורים אישיים ומרהיבים לחיים המודרניים וגם כלים חדשים ומעולים לשימוש בעתיד.

הנה הארטיפקט של קלוד, שאחרי קידוד ניתן לשתף את יצירתכם ב-Publish לאחרים:

https://youtu.be/vUdNaAAc4FY

שיעור תכנות ללא תכנות בכלי Lovable:

https://youtu.be/gqsZGxuymTk?long=yes

Websim.ai הוא כלי קוד שמשלב את העיצוב בקידוד וניתן לתכנת בו ללא תכנות:

https://youtu.be/HCw4jCbLgMY

Replit הוא כלי שבו ניתן לקודד גם בסמארטפון:

https://youtu.be/Cmq3TrS3ccU

כלי קוד מבוססי אינטליגנציה מלאכותית:

https://youtu.be/3cVJxRka4yM

השוואה של 3 מודלי שפה LLMs במהירות יצירת קוד למטלה זהה:

https://youtu.be/_JS-LkBrsk8

יישום של תוכנה שפותחה כך, ללא כתיבת קוד:

https://youtu.be/lkom9ufvxD4

איך ChatGPT בניתוח קוד? (עברית)

https://youtu.be/Z46pqHFuKHs

רפליט הוא כלי קוד בינתי מתקדם יותר:

https://youtu.be/FrMy3Bq7TZA

מדריך מתחילים לתכנות עם Cursor AI:

https://youtu.be/ocMOZpuAMw4?long=yes

ומדריך לעבודה עם Windsurf:

https://youtu.be/4nCMdQadE08?long=yes

מה היתרון של כלי פיתוח קוד מבוססי AI?

מחשב מתכנת לבדו? - באופן מסוים כן. כי כלי קוד מבוססי בינה מלאכותית (AI-based code tools) מאפשרים לשלב את הרעיון או המומחיות האנושית עם היכולות של הבינה המלאכותית, כדי לפתח תוכנה ולעשות זאת ללא קידוד של המשתמש או באמצעות שיתוף פעולה בין המשתמש ל-AI.

קידוד מבוסס AI מתבסס על בינה מלאכותית ככותבת הקוד. כתיבת הקוד מתבססת על מודל שפה שאומן על נתוני דאטה עצומים ולמד קידוד.

המשתמש מאפיין את המוצר, אם זה אתר אינטרנט, תוכנה או אפליקציה לטלפון ומתאר אותו באמצעות פרומפט, הנחייה שהוא כותב לבינה היוצרת בלשון טבעית, כלומר שפה רגילה, שפת יום יום וללא צורך בידע בתכנות.

החיבור בין הרעיון והשכל האנושי ובין האינטליגנציה המלאכותית מאפשרים ניהול וביצוע משימות פיתוח, בשיתוף פעולה ועצמאות גם יחד.

באמצעות תכונות של AI מקודד ניתן לתאר ל-AI את המטרה, לקבל קוד, להנחות אותה כיצד להתקדם בפתרון בעיות או באגים בקוד ולהוביל ביחד לקוד איכותי ולמימוש הרעיון.

ה-AI המקודד מודע לפעולות המשתמש בזמן אמת ומציע יתרונות אדירים. הוא מסוגל לערוך קבצים מרובים במהירות אדירה, להציע פקודות, לזהות בעיות ולנפות באגים.

כלי הקוד המשובח "Windsurf AI", למשל, מפעיל סוכני AI מובנים, יחד עם מעין "טייסי משנה" מונעי בינה מלאכותית, שמטרתם להטעין את הקוד ולהפוך את הקידוד למהיר ואינטואיטיבי יותר.

בעצם, Windsurf ודומיו, דוגמת Cursor AI שהיה חלוץ הכלים הללו, הם מעין סביבת פיתוח (IDE) מהדור החדש, המשפרות את הפיתוח בעזרת אוטומציה חכמה ומציעות עריכת קוד בסביבה מרובת קבצים. וינדסרף עושה זאת, בין השאר, בעזרת כלי שנקרא Cascade ומצטיין במודעות עמוקה לקונטקסט, ההקשר הכל כך בסיסי ומרכזי בבינה המלאכותית היוצרת (Generative AI).

כלי נוסף וקל הרבה יותר הוא Websim AI, המאפשר לתאר אתר או אפליקציה, או סתם לתת שם דומיין מדומה, והיא יוצרת אותם. מכאן אפשר להנחות אותה בצעדים, איטרציות, מה שמאפשר לדייק אותה, לשפר, לשדרג ולבנות הלאה.

הנה כלי קוד מבוססי אינטליגנציה מלאכותית:

https://youtu.be/3cVJxRka4yM

AnyChat מצויד בדיפסיק וסמבה נובה לקידוד פשוט:

https://youtu.be/7BIVWQnAOLk?t=2m54s

השוואה של 3 מודלי שפה LLMs במהירות יצירת קוד למטלה זהה:

https://youtu.be/_JS-LkBrsk8

השוואת 5 כלי קוד מובילים והמנצח המפתיע:

https://youtu.be/WVhJSUtGbYM

יישום של תוכנה שפותחה כך, ללא כתיבת קוד:

https://youtu.be/lkom9ufvxD4

Websim.ai הוא כלי קוד קל מאוד וקסם ללא תכנות:

https://youtu.be/HCw4jCbLgMY

איך ChatGPT בניתוח קוד? (עברית)

https://youtu.be/Z46pqHFuKHs

רפליט הוא כלי קוד בינתי מתקדם יותר:

https://youtu.be/FrMy3Bq7TZA

לקודד אפשר גם בסמארטפון:

https://youtu.be/Cmq3TrS3ccU

מדריך מתחילים לתכנות עם Cursor AI:

https://youtu.be/ocMOZpuAMw4?long=yes

ומדריך לעבודה עם Windsurf:

https://youtu.be/4nCMdQadE08?long=yes

מה דיפ ריסרץ' עושה במחקר AI מעמיק?

אפשר לראות בזה רק עניין מיתוגי, אך לעומת סתם דיפ סרץ' כלי הדיפ ריסרץ' (Deep Research) מבטיח להיות מנוע מחקר, סוג של מנוע חיפוש, איסוף וכתיבה חכם שתוכנן כך שיוכל לבצע מחקרים מעמיקים ולא רק חיפושים לצורך מענה.

אמנם בכלי מחקר מעמיק שכזה המשתמש שואל את הצ'ט באמצעות פרומפט רגיל ופשוט. אך החיפוש יהיה מעמיק יותר וגם התשובה המתקבלת תהיה מעמיקה בהרבה. זו גם הסיבה שזמן ההמתנה לקבלת מענה יהיה של כמה דקות ועד שעה.

כלי DeepResearch טובים ינפיקו בדרך כלל תוצאות תוך דקות, או יותר במקרה של מחקרים סופר מורכבים. המדהים הוא שלצד איכות התוצאות, ההולכת ומשתפרת ברמה של ימים ממש, הן מתקבלות בחיפוש מהיר שכזה ובמחיר כמעט אפסי.

מחקר שמומחה אנושי היה מבצע במשך שבוע ומחירו היה בסדרי גודל של כ-3,000 דולר אורך בדרך כלל דקות ועלותו זניחה.

ביצוע של מחקר עומק עם הדיפ-ריסרץ' של מודלים אופייניים כמו פרפלקסיטי (Perplexity), ChatGPT או Grok3, למשל, יבצע מחקר, איסוף של מקורות, לאחר מכן שלבים שונים, כמו אינטגרציה, השוואה ושילוב ולבסוף ייתן מענה מפורט. כל זאת תוך שהוא מפרט את שלבי העבודה לעיני המשתמש, בשקיפות מירבית.

מודל הדיפ ריסרץ' סורק את האינטרנט ומאתר מקורות מידע רבים יותר ומגוונים ועושה מאמצים לנפק מענה ברמת דוקטור - תשובה מלאה, מנומקת וכזו שבה מוצגים המקורות שעליהם מבוססת התשובה.

ביצוע של מחקר עומק שכזה מסוגל גם לשפר את רמת השקיפות והאינטראקציה והוא אתגר חשוב בדרך לבינה מלאכותית בוגרת עוד יותר.

כלומר, בניגוד למודל AI רגיל שנוהג לענות במהירות ומבצע הליך חפוז של חקר עד לקבלת המענה הסביר, מה שגם מוליד לצערנו את ההזיות המוכרות לנו עדיין, מנוע חיפוש עמוק, כמו אלו של מודלי ה-DeepResearch המובילים בתחום, עובד אחרת.

איך?

מנוע מחקר DeepResearch מפשט שאילתות לחלקים קטנים יותר ומאפשר כמעט תמיד הצצה והבנה שקופה של תהליך החשיבה שלו, צעד אחר צעד. בכך הוא יכול גם להציע תובנות הקשריות עשירות הרבה יותר מחיפוש רגיל באמצעות AI ובמקרים מסוימים גם לנמק.

כך מבצע Perplexity מחקר עומק מבוסס AI בחינם:

https://youtu.be/Z1_M2XtsUwY

החיפוש המעמיק של כלי ה-DeepResearch:

https://youtu.be/zm6F0vo2E64

הדיפ ריסרץ' של Chatgpt שעולה 200$ לחודש:

https://youtu.be/jPR1NEerdEk

מדריך לעבודה עם ה-DeepResearch החינמי ומהיר של Grok 3:

https://youtu.be/7pR3bVWZSao

והשוואה בין כמה מודלי Deep Search:

https://youtu.be/5dRxhqtIbOg?long=yes

מהו ומה היתרון של מודל שפה קטן, או SLM?

מודל שפה קטן (Small Language Model), ובקיצור SLM, הוא מודל מתמחה או מומחה, דגם קטן יותר ומזוקק, מה שהופך אותו להבטחה גדולה וממשית לצרכים עסקיים, בעולם האמיתי.

מודלים קטנים של שפה, או כמו שתרגום מכונה מכנה בטעות "מודלים של שפות קטנות", מאפשרים היום אימון בינה מלאכותית על ידע ספציפי לתחומים שונים ובכך להתאימם לתעשיות ספציפיות, משימות וזרימות עבודה תפעוליות.

SLM הוא קצת כמו סוס חזק ומהיר שיכול לבצע משימות ממוקדות, לעומת כרכרות LLM עמוסות, כבדות ולכן גם מוגבלות בתמרון.

שוב ושוב נשאלת השאלה האם יכולים מודלי שפה קטנים (SLMs) לנצח את ה-ChatGPTים או ה-Claudeים למיניהם, את האחים הגדולים והוותיקים, המצוידים, מאומנים ועתירי המשאבים מעולם ה-LLMs?

או במספרים - האם מודל של מיליארד בודד של פרמטרים (1B) יכול לגבור על היכולות של מודל עם 405B פרמטרים, יותר מפי 400 ממנו?

אז כן. בניגוד למודל שפה גדול של עולם ה-LLMs, שמעבד כמויות אדירות של ידע כללי, המודל הקטן מעולם ה-SLMs בנוי במחשבה על דיוק ויעילות. עלות הפעלתו היא נמוכה משמעותית, הוא דורש פחות כוח חישוב ובנוי כדי לספק תובנות רלוונטיות יותר לעסק מאשר מקביליו הגדולים והכלליים.

בעולם המודלים הגדולים של שפה כבר הסתבר שאופטימיזציה של החישובים ב-SLMs כאלה יכולה אכן לעלות את היכולות של הקטנים הללו על אלו של דגמים גדולים יותר, שמנסים ומצליחים להיות חכמים מכולם ויודעי-כל, אבל תפעולם יקר ומסורבל יותר והם לא יעמדו ביכולות ההתמחות של מודל קטן שלא מביט לצדדים ומרוכז רק במשימתו.

מחקרים שבחנו את היעילות של שיטה ששמה Compute-Optimal TTS, למשל, הראו ששיפור הביצועים של מודלים קטנים מאפשר לעלות בהם את הביצועים על אלו של דגמים גדולים יותר, במשימות מתמטיות כמו MATH-500 ו-AIME24 ובשיפור יכולות החשיבה של LLM.

#ביצועים, התמחות ואבטחת נתונים
לא מעט חברות וארגונים מבינים שהשאלה היא לא על איזה מודל בינה מלאכותית אנשים קופצים, אלא איזה מודל יספק לחברה או לארגון ערך עסקי אמיתי. SLMs מאפשרים לעסקים לפרוס AI ישירות על מחשבים ניידים, רובוטים וטלפונים ניידים ולהבטיח בכך גם שהנתונים, הדאטה שלהם, יישארו מוגנים.

דגמי SLM, שמותאמים להצטיין בתחומים ספציפיים - פיתוח תוכנה, רפואה, פיננסים וכדומה, יספקו תוצאות מדויקות ואמינות יותר, המותאמות לצרכי הארגון הייחודיים וליכולותיו.

ה-SLMs המזוקקים והקטנים יותר מצליחים לשמור על יכולות חשיבה חזקות וממוקדות תחום, ביחד עם יעילות המאפשרת להם לפעול באופן מקומי, מבלי להסתמך על מחשוב ענן.

#סוכני AI
אם SLMs מצוינים עבור עסקים הרוצים לייצר משימות אוטומציה שלא נזקקות לכל הרעש והצלצולים שמציע ה-LLM, אז מה עם סוכני בינה משויפים?

אז ברור שגם מפתחים של סוכני AI צריכים דגמים קלים, מהירים ומתמחים מאוד, המאומנים על ידע מעמיק וספציפי לתחום בו מתמחה הסוכן. בזכות דרישות המשאבים המצומצמות והגודל הקטן יותר שלהם, שירותי SLM יכולים בדרך כלל להתאים בול למגמת ה-Agentic AI, בכך שהם מאפשרים קבלת החלטות אוטונומית בקצה.

אמנם מודלי SLM עשויים לדרוש הכשרה מיוחדת מלכתחילה, אבל מנגד עומד היתרון של הפחתת הסיכונים הכרוכים בשימוש ב-LLM של צד שלישי וספקים חיצוניים. זהו יתרון עצום, המצטרף לשאר יתרונותיהם: יכולת הסבר גדולה יותר, ביצועים מהירים יותר ויכולת ביצוע מדויק, עקבי ושקוף יותר, המצטרפים לשליטה רבה יותר על פרטיות ואבטחת הנתונים.

#שילוב של המודלים
כיום מבינים שאמנם אין תחרות ל-LLMs בגודל ובעוצמה, אך הסתמכות יתר עליהם יכולה להוביל לתחושת ביטחון מוגזמת, לשאננות ולטעויות קריטיות שעלולות לחמוק מבלי להתגלות.

כך שאולי LLMs ו-SLMs אינם סותרים אלא משלימים. יתכן שבפועל, SLMs יכולים לחזק את ה-LLMs וליצור פתרונות היברידיים, משולבים, שבהם ה-SLMs ממונים על הביצוע הספציפי והמדויק בעוד ה-LLMs מספקים את הקונטקסט, ההקשר הרחב יותר .

מהם SLMs ומה יתרונות מודלי השפה הקטנים הללו:

https://youtu.be/C4Qt9Hnp6vs

הסבר פשוט וקצר:

https://youtu.be/AlwWuSor_M4

למה לבחור SLM ולאילו מגבלות לשים לב אל מול ה-LLM?

https://youtu.be/Hg8f5bjtsWc

ומודל השפה הקטן של מיסטרל:

https://youtu.be/nCXTdcggwkM

מהם מודלי שפה גדולים, או LLM?

מודל שפה גדול (LLM), קיצור של Large Language Model, הוא ה"מוח" שמפעיל צ'אטבוט עוצמתי, כמו הצ'אטבוט ChatGPT, המייצר תוכן לבקשת המשתמשים ועושה זאת באמצעות מודל השפה הגדול GPT-4 ואחרים.

את התוכן מייצר הצ'אטבוט מדאטה עצום, כמות מידע אדירה שנשאבה מהאינטרנט ובאמצעותה אימנו את מודל השפה שמפעיל אותו. מודלי השפה GPT-3 ו-GPT-4, למשל, הם שמפעילים את הצ'אטבוט הכי מפורסם ChatGPT.

יש שאומרים שמודל השפה בעצם הוא לא יותר ממחולל מילים סטטיסטי. הם צודקים אבל גם טועים. כי מודל שפה יכול לחשב מצוין הסתברות של הופעת מילים שונות בכל משפט וכך לייצר משפטים חדשים, מילה אחר מילה, בשפה שבה הוא אומן על ידי המפתחים שלו. אבל זו דוגמה בלבד ואפילו קצת מטעה. כי סטטיסטיקה זה לא הכל וכנראה לא לגמרי המהות של העניין. המוח של מודל השפה, האופן שבו הוא בנוי והתובנות והביצועים שהוא יכול לנפק, הם משמעותיים הרבה יותר.

מודל כזה הוא תת-תחום של למידה עמוקה ומבוסס על רשת עצבית מלאכותית הבנויה בצורה דומה למוח האנושי. הרשת הזו היא בעלת כמות אדירה של פרמטרים, לרוב מיליארדים. הפרמטרים הללו הם ערכים מספריים שמסייעים לאלגוריתם ללמוד.

עוד ביטוי לגודלו הגדול של המודל הוא באימון שלו על מאות מיליוני מילים, בכמויות ענק של טקסט לא מתויג, בשיטת למידה שאינה מסתמכת רק על דוגמאות אנושיות, או מה שנקרא "למידה בפיקוח-עצמי".

#איך זה בדיוק עובד?
נניח ששאלתם שאלה, מודל השפה הגדול מניח את נוסח השאלה על שולחן הטיפולים שלו ובודק בדאטה שלו, במידע העצום שהוא אגר והמיר לקוד מתמטי (ראו אח"כ בתגית" טוקנים"), מה המילה שהכי סביר (מבחינת הסתברות) שתתחיל את התשובה. ואז הוא בודק מה המילה עם ההסתברות הכי גבוהה להופיע אחריה וכך הלאה. זה ייתן לו את התשובה הסבירה ביותר לשאלה.

למה הכי סבירה ולא הכי טובה? - כי הסתברות היא לעולם לא מושלמת וזו בדיוק הסיבה להזיות שנקבל לא פעם ממנועי בינה מלאכותית. אגב, אם תבקשו ממנו לבדוק את תשובתו, כל LLM ימצא ויפרט את שגיאותיו וגם יציע לתקן את המענה שנתן ובתיקון זה כבר יהיה הרבה יותר טוב.

ה-LLM משתמש בייצוג מתמטי של שפה טבעית באמצעות הסתברויות. כל מדען נתונים יאשר שהבסיס של מודלי שפה הוא היכולת שלהם לחשב הסתברות לכל משפט בשפה שבה הם אומנו ומהיכולת הזו נובע חלק משמעותי ביכולת שלהם לייצר משפטים חדשים, מילה אחר מילה.

#מודלי השפה הגדולים והבינה הג'נרטיבית
מודל השפה הגדול הוא בעצם הבסיס למהפכת הבינה הגנרטיבית שפרצה לחיינו בשלהי 2022-תחילת 23. מודלי השפה הגדולים הללו מסמנים קפיצת דרך של ממש ולמעשה הכניסו אותנו עמוק אל תוך העתיד.

הייתה זו IBM שפיתחה את אחד ממודלי השפה הראשונים. הוא נקרא ווטסון, על שם תומאס ווטסון, מייסד IBM. יש גרסה שאומרת שהוא קיבל את שמו משמו משם העוזר של שרלוק הולמס, ווטסון. מודל כזה, ממש כמו אותו עוזר, תמיד מסייע בחקר ובתשובות שונות, כיום של רבים ואצל שרלוק, לצרכי החקירות של הבלש הנודע.

מצוידים במודלים החדשים, הצ'אטבוטים המרשימים, כמו Claude ו-ChatGPT, מסרבים להיות לכם לווטסון. במקום זאת הם מפותחים כך שיהיו המוח, כלומר השרלוק שלכם, כשאתם וכמה זה אירוני, בתפקיד הווטסון או העוזר שלהם... אבל גם הלקוחות.

מודל שפה הוא שמאפשר לנו לבקש ממנו לסכם טקסטים, לענות על שאלות, לצייר או בעצם לייצר תמונות ו"צילומים", לחבר שירים, ליצור סרטונים או לכתוב קוד.

אז מודלי שפה גדולים אפשרו את קפיצת הדרך המדהימה של מהפכת ה-AI. אמנם הם רחוקים מלהיות מושלמים לחלוטין ועדיין פה ושם מקלקלים את ההתפעלות עם ההזיות המוכרות האלה שלהם, עובדות שגויות, מידע לא רלוונטי או מופרך ואפילו עלבונות נדירים. ומה שלא פחות מרגיז לעתים הוא הביטחון המלא שבו הם כותבים או מדברים אותן, שזה בדיוק מה שהופך את חשיפת ההזיות ובדיות הללו לכל כך קשה ומסוכנת...

כיום, המודלים הללו הולכים ומאפשרים צמיחה של עולם חדש, עולם סוכני ה-AI. הם ממוקדים בביצוע משימות ספציפיות, תגובה לסביבה ועוד תכונות מבטיחות. הכירו אותם בתגית "סוכני AI".

הנה מה שעושים המודלים, מנועי השפה הגדולים (מתורגם):

https://youtu.be/X-AWdfSFCHQ

כך פורצת מלחמת עולם ה-AI הראשונה:

https://youtu.be/nJjuYTpHQEE

מהו LLM?

https://youtu.be/iR2O2GPbB0E

המודל השולט בינואר 2025 - DeepSeek R1 הסיני:

https://youtu.be/hupQ97Or3jw

השוואת הצ'טבוטים הטובים, מנועי השפה הגדולים בסוף 2024 (עברית):

https://youtu.be/NanvGTQeO-g

כך פועל מודל השפה הגדול LLM:

https://youtu.be/iR2O2GPbB0E

כך בנויים ופועלים מודלי השפה הגדולים:

https://youtu.be/5sLYAQS9sWQ

יש להם גם חסרונות:

https://youtu.be/Gf_sgim24pI

הסבר מעמיק על מודלים גדולים של שפה ומה שהם הובילו (עברית):

https://youtu.be/-NIsUKUnxhA?long=yes

הפרמטרים והטוקנים באימון מודלים כאלו:

https://youtu.be/r17HV0TzAWw?long=yes

ובאופן סטטיסטי - כך פועל LLM:

https://youtu.be/LPZh9BOjkQs?long=yes

מנועים בינתיים

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!