שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.
»
«
מה זה סטוריבורד?
סטוריבורד (StoryBoard) בקולנוע הוא תיאור של השוטים המתוכננים לצילום, לרוב כשהם מצויירים על גבי נייר, כמו בקומיקס. מדובר בלוח תכנון שביצירתו יוצרי סרטים מקילים ומשביחים את תהליך הפרה-פרודקשן של הסרט.
בסטוריבורד מתוארים הצילומים המתוכננים מראש, בצורה ויזואלית, כדי לתאר את צילומי הווידאו או הפילם המתוכננים, עוד לפני הצילום.
המטרה של הסטוריבורד, בעברית "לוח סיפור", היא להקל על הבמאי ועל בעלי המקצוע השונים, בתכנון של צילומי הסרט.
הסטורי בורד מאפשר להבין את הסרט כפי שייראה על ציר הזמן, תמונה אחרי תמונה. הוא מסייע להמחיש את הסיפור, שוט אחרי שוט.
בעזרת הסטורי בורד ניתן לבדוק ולבקר מראש ובקלות רבה יותר דברים כמו מה עובד בסיפור ומה לא, לסמן כמה זמן ייקח כל שוט בסרט, לבחון האם הזרימה בין השוטים עובדת היטב והאם החיתוכים בין השוטים עובדים נכון.
בתור ייצוג גרפי של האופן שבו הסרט יתפתח, צילום אחר צילום, ייתכן שיצירת סטוריבורד נראה כמו שלב נוסף ואולי מיותר בתהליך הכנת סרט קצר או סרטון, אבל מדובר בשלב שמומלץ לעשות מה שניתן כדי לא לדלג עליו.
מקור השם "סטורי בורד" מגיע מהנוהג שהיה באולפני האנימציה הגדולים של פעם, לתלות איורים של כל שוט ושוט בסרט, על גבי לוח גדול על קיר האולפן. האיורים הללו איפשרו לצוות להתייחס לתכנית-העל של הסרט והוא היווה מעין מתכון להכנתו.
הנה דוגמה קצרה לסטורי בורד (עברית):
https://youtu.be/Rz1E0O3PSSw
מה זה סטורי בורד?
https://youtu.be/bpZjnH9wA4k
איך הסטוריבורד עובד?
https://youtu.be/6aTnEanIXBk
דוגמה לסטורי בורד מומחז בווידאו (עברית):
https://youtu.be/udK6HLxpaJE
הדרכה כיצד לעשות סטורי בורד, גם אם אינכם ציירים:
https://youtu.be/ux_Em1lVsjI
ויצירת סטוריבורד באמצעות כלי AI בסגנון של "Black and white sketch drawing style":
https://youtu.be/MKOG__oIe1o
איך יוצרים סרטים וסרטונים ב-AI?
כלי יצירת וידאו בעזרת בינה מלאכותית גנרטיבית מתפתחים במהירות אדירה. עד לא מזמן זו הייתה המהפכה הבאה של הבינה המלאכותית, אבל מהירות הפיתוח של הטכנולוגיה הזו, כמו כל תחום הבינה הגנרטיבית, היא בלתי נתפסת ולכן היא כבר כאן ולא עוצרת לרגע.
וכך, נוסקים מה שהיו שנה קודם סרטונים של 4-5 שניות באיכות תמונה בסיסית עד נמוכה והבנה בינונית למדי של הפרומפטים (ההנחיות הטקסטואליות שבהן מתאר המשתמש את התוצאה המבוקשת). בתוך שנה הם הפכו לסרטונים מעולים, באיכות תמונה מעולה, היצמדות להנחיות הפרומפט ומאפשרים לבקש זוויות צילום, סוגי שוטים, סוג או ז'אנר הסרט ועוד.
וגם קהילת הקוד הפתוח (ראו בתגית "קוד פתוח") לא טומנת ידה בצלחת. לעומת מודלים מסחריים סגורים ויקרים למשתמש, המודלים שלהם מאפשרים יצירת סרטונים בארכיטקטורה עם שקיפות וחדשנות וללא עלות, תוך אימוץ של טכנולוגיות AI מהחדשניות ביותר, גם בחינם להורדה והרצה על המחשב המשתמש וגם אונליין, בהגבלות בשל העלות שעולה לשתפן כך.
מדהים לחשוב שמה שבעבר צולם באלפי דולרים מינימום לשניה של סרט, נוצר עכשיו בכמה פקודות מקלדת, שמייצרות סרטונים שווי ערך להפקה מורכבת, יקרה, עתירת מקצוענות וכוח אדם, כשלא פעם ביצועי אפקטים מיוחדים ו-CGI, יקרים ומורכבים לצילום, מוחלפים במחי פקודת מקלדת פשוטה ודמיון מפותח של היוצרים.
היום הבינה המלאכותית יוצרת סרטונים מעולים וברמה מטורפת, אפילו על בסיס של תמונות סטילס (תמונות רגילות), שהועלו אליה ונוספה להם הנחייה שאומרת מה "עושים" האובייקטים שבתמונה כשהם "משתתפים בצילומים".
וזה בדיוק מה שמדאיג היום רבים בתעשיית הקולנוע. קשה להימלט מהמחשבה כמה ואילו מקצועות עומדים להיעלם בקרוב מהעולם, מהמסך, הגדול או הקטן. בצל הקדמה הזו עלולים כמה א.נשים לאבד את פרנסתם. החלפתם הצפויה בבינה מלאכותית תהיה כי היא זולה, יעילה, צייתנית וכזו שאף פעם לא חולה, לא עצובה ולא מאחרת, כי הילד שלה מרגיש לא טוב בבית...
אז לצד זה שהבינה המלאכותית מרגשת, תורמת ליצירתיות וגלומות בה אינספור אפשרויות בלתי נגמרות, היא טומנת בחובה גם איומים וסכנות לאנושות ולנו בני האדם. תעשיית הקולנוע כולה עלולה להיות מוחלפת בהדרגה במיליוני רובוטים שקוראים להם AI ואין להם אפילו גוף לחבוט בו. רק אינטליגנציה מלאכותית, שלא מרחמת ולא חומלת, כי היא עושה רק מה שאומרים לה. במקלדת, כן?
הפתרון, כי חייבים לדבר אופטימית שוטפת, הוא ללמוד את הכלים החדשים הללו. יידע כל מקצוען קולנוע שבמקום להיות מוחלף ב-AI, עדיף לדעת AI ולהשתלב בעולם החדש הזה.
הנה האינטגרטיבית שעושה את הכל מפרומפט קטן:
https://youtu.be/Aw1TQwkCLQs
מינימקס המטורפת בווידאו AI:
https://youtu.be/4QXCV_TYKZc?long=yes
מודל וידאו בינתי ישראלי (עברית):
https://youtu.be/CkpLiPWLcHo
אפשרויות הווידאו AI שהולכות ומתפתחות במהירות - הנה Neurawik:
https://youtu.be/1HVkzZiv82Q
סרטון AI שנוצר באמצעות Google Veo 2 המדהים:
https://youtu.be/25adlZRtUCo
האם מתקרב הסוף של עשיית סרטים רגילה? (עברית)
https://youtu.be/kx3H1jFHncY
דברים שרק AI יכול לעשות (ללא מילים):
https://youtu.be/f-Vbm-iQ_Xw
הדרכה ל-Image to Video שהופכת תמונה לסרטון וידאו (עברית):
https://youtu.be/mR3rN8vphC8
קליפ AI של שיר של הביטלס:
https://youtu.be/Z9MZdNrGbM4
כך יוצרים מתמונות בעזרת פרומפט וידאו AI בקלות עם Minimax (עברית):
https://youtu.be/F-gl4E5yo60
כך יוצרים לייב פורטרייט - דיוקן עם מחוות שלכם:
https://youtu.be/kM3KSrPrh9c
קליפ מתמונה:
https://youtu.be/yCczY9PNeao
קדימון AI מדומה לסרט מדע בדיוני שלא קיים. האם בקרוב הסרט?
https://youtu.be/oAIrJP4n5sQ
כך מחליפים פנים לדמויות וידאו, מה שנקרא Faceswap:
https://youtu.be/vVs0DZ8VyGQ
על סקיצה של ג'ון לנון שהושלמה 40 שנה אחרי מותו עם קליפ משולב דמויות AI:
https://youtu.be/APJAQoSCwuA?long=yes
Magic Hour AI - כלי שיוצר סרטונים עד 60 שניות, שזה הכי הרבה:
https://youtu.be/eSpuvmRhcPg?long=yes
KREA - מודל ליצירת סרטונים AI:
https://youtu.be/OBewafac0Xs?long=yes
MINIMAX - עוד מודל וידאו מדהים מסין:
https://youtu.be/7JZLLxV1AGc?long=yes
כלי וידאו שמייצר ישר סרטון רב-סצנות:
https://youtu.be/BCCUNiToo94?long=yes
כלי הווידאו המומלצים לתחילת 2025:
https://youtu.be/K04zRJ8Vl_s?long=yes
וכך מייצרים סרטי וידאו ארוכים ב-Canva תחילת 2025:
https://youtu.be/tWmVbn4rUd0?long=yes
מה היתרון של כלי פיתוח קוד מבוססי AI?
מחשב מתכנת לבדו? - באופן מסוים כן. כי כלי קוד מבוססי בינה מלאכותית (AI-based code tools) מאפשרים לשלב את הרעיון או המומחיות האנושית עם היכולות של הבינה המלאכותית, כדי לפתח תוכנה ולעשות זאת ללא קידוד של המשתמש או באמצעות שיתוף פעולה בין המשתמש ל-AI.
קידוד מבוסס AI מתבסס על בינה מלאכותית ככותבת הקוד. כתיבת הקוד מתבססת על מודל שפה שאומן על נתוני דאטה עצומים ולמד קידוד.
המשתמש מאפיין את המוצר, אם זה אתר אינטרנט, תוכנה או אפליקציה לטלפון ומתאר אותו באמצעות פרומפט, הנחייה שהוא כותב לבינה היוצרת בלשון טבעית, כלומר שפה רגילה, שפת יום יום וללא צורך בידע בתכנות.
החיבור בין הרעיון והשכל האנושי ובין האינטליגנציה המלאכותית מאפשרים ניהול וביצוע משימות פיתוח, בשיתוף פעולה ועצמאות גם יחד.
באמצעות תכונות של AI מקודד ניתן לתאר ל-AI את המטרה, לקבל קוד, להנחות אותה כיצד להתקדם בפתרון בעיות או באגים בקוד ולהוביל ביחד לקוד איכותי ולמימוש הרעיון.
ה-AI המקודד מודע לפעולות המשתמש בזמן אמת ומציע יתרונות אדירים. הוא מסוגל לערוך קבצים מרובים במהירות אדירה, להציע פקודות, לזהות בעיות ולנפות באגים.
כלי הקוד המשובח "Windsurf AI", למשל, מפעיל סוכני AI מובנים, יחד עם מעין "טייסי משנה" מונעי בינה מלאכותית, שמטרתם להטעין את הקוד ולהפוך את הקידוד למהיר ואינטואיטיבי יותר.
בעצם, Windsurf ודומיו, דוגמת Cursor AI שהיה חלוץ הכלים הללו, הם מעין סביבת פיתוח (IDE) מהדור החדש, המשפרות את הפיתוח בעזרת אוטומציה חכמה ומציעות עריכת קוד בסביבה מרובת קבצים. וינדסרף עושה זאת, בין השאר, בעזרת כלי שנקרא Cascade ומצטיין במודעות עמוקה לקונטקסט, ההקשר הכל כך בסיסי ומרכזי בבינה המלאכותית היוצרת (Generative AI).
כלי נוסף וקל הרבה יותר הוא Websim AI, המאפשר לתאר אתר או אפליקציה, או סתם לתת שם דומיין מדומה, והיא יוצרת אותם. מכאן אפשר להנחות אותה בצעדים, איטרציות, מה שמאפשר לדייק אותה, לשפר, לשדרג ולבנות הלאה.
הנה כלי קוד מבוססי אינטליגנציה מלאכותית:
https://youtu.be/3cVJxRka4yM
השוואה של 3 מודלי שפה LLMs במהירות יצירת קוד למטלה זהה:
https://youtu.be/_JS-LkBrsk8
יישום של תוכנה שפותחה כך, ללא כתיבת קוד:
https://youtu.be/lkom9ufvxD4
Websim.ai הוא כלי קוד קל מאוד וקסם ללא תכנות:
https://youtu.be/HCw4jCbLgMY
איך ChatGPT בניתוח קוד? (עברית)
https://youtu.be/Z46pqHFuKHs
רפליט הוא כלי קוד בינתי מתקדם יותר:
https://youtu.be/FrMy3Bq7TZA
לקודד אפשר גם בסמארטפון:
https://youtu.be/Cmq3TrS3ccU
מדריך מתחילים לתכנות עם Cursor AI:
https://youtu.be/ocMOZpuAMw4?long=yes
ומדריך לעבודה עם Windsurf:
https://youtu.be/4nCMdQadE08?long=yes
מהי המוסיקה שיוצר ה-AI?
המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.
הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:
1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.
2. ללמוד מהדאטה הזה איך הדברים נשמעים.
3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).
פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.
את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.
היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.
פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.
עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.
הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:
https://youtu.be/3_pxKK2wqvI
הבינה המוסיקלית המדהימה של Udio:
https://youtu.be/aQC0FI_asKY
המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:
https://youtu.be/dAq0YcOAB4k
ההבטחה של Fugatto של אנבידיה:
https://youtu.be/qj1Sp8He6e4
הדוגמאות של המודל הבא מ-Eleven labs:
https://youtu.be/WA4Aco4rnTA
טעם רע או אזהרה - הקליפ של Apple שמדגים את החשש של המוסיקאים דווקא מ-Ai:
https://youtu.be/ntjkwIXWtrc
תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:
https://youtu.be/Xfhulh3iyWQ
מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:
https://youtu.be/iQ6ITnYAIok
Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:
https://youtu.be/FSbXnOKBK40
Riffusion - הכלי החדש ליצירת מוסיקת AI (עברית):
https://youtu.be/c5_agjg-_Q4?long=yes
ההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:
https://youtu.be/cvRJ_izhs28?long=yes
ואיך עובדים עם סונו 4:
https://youtu.be/5zYHm35V998?long=yes
איך התכנות יורד לעם בעזרת בינה מלאכותית יוצרת?
בימי AI אלה, של פברואר 2025, נראה שאנו רואים את השינוי בכתיבת קוד בכלל ובתכנות של אפליקציות לסוגיהן בפרט.
וזה לא ממש תכנות, עם כתיבת קוד וחלוקה למסמכים שיוצרים תוכנה, אלא יותר תהליך של חשיבה וחלוקת הוראות. כולנו יכולים לחשוב על רעיון, לנסח אותו כפרומפט, אולי גם לדמיין ולצייר מסכים, להציגם ל-AI, לראות קוד ואת התוצאה, לאשר או להציע תיקונים, לשפר את המודל ולראות את התוצאה משתפרת.
גם אם זה נשמע בלתי אפשרי, זה בדיוק מה שהבינה היוצרת מאפשרת כיום, כמעט לכל אחד, כולל מי שלא למדו מעולם לקודד ולתכנת. אחד מגאוני ה-AI של הדור החדש, אנדריי קרפאטי (Andrej Karpathy), מסביר שכלי ה-GenAI משנים את אופן פיתוח התוכנה מהיסוד וקורא לזה “תכנות וייב” (Vibe Coding).
תכנות הווייב פירושו תכנות שלא בקוד אלא של מפתחים שמתרכזים ברעיונות הגדולים ונותנים ל-AI לטפל בשאר - מהקוד והאיטרציות (שפירושן שיפור וניסוי שוב ושוב), דרך הפרטים הטכניים, הטיפול בבסיס הנתונים (Database), ב-API ובהעלאת הכלי לאונליין (Deployment).
ומדובר בשינוי של כל החוקים שהכרנו. המעבר הזה מכתיבת הקוד לפתרון בעיות באמצעות חשיבה מדויקת ככל האפשר, הנחיות ל-AI, עיצוב מסכים והעלאתם כטיוטות עיצוב לבינה, כל אלו הם חלום שמתממש. משמעותם הפשוטה היא דמוקרטיזציה של עולם פיתוח התוכנה.
והאפשרויות החדשות הללו מאפשרות עכשיו גם לאנשים ללא רקע תכנותי או היכרות והבנה בקוד, להגשים את רעיונותיהם - על ידי יצירה של תוכנות מקוונות, אפליקציות או כלים שונים, באמצעות כלים בינתיים וטכנולוגיים, המופעלים על ידי אדם ולידו בינה מלאכותית, שמקבלת ומבצעת הוראות.
אז המרחק, שבעבר היה גדול מאוד, בין הרעיון למימושו, תלוי עכשיו במשתמש ורק בו. כלים רבים לקידוד מבוסס פרומפטים יש כיום והם משתכללים מיום ליום. המוח האנושי יידע להנפיק מהם גם שיפורים אישיים ומרהיבים לחיים המודרניים וגם כלים חדשים ומעולים לשימוש בעתיד.
הנה הארטיפקט של קלוד, שאחרי קידוד ניתן לשתף את יצירתכם ב-Publish לאחרים:
https://youtu.be/vUdNaAAc4FY
שיעור תכנות ללא תכנות בכלי Lovable:
https://youtu.be/gqsZGxuymTk?long=yes
Websim.ai הוא כלי קוד שמשלב את העיצוב בקידוד וניתן לתכנת בו ללא תכנות:
https://youtu.be/HCw4jCbLgMY
Replit הוא כלי שבו ניתן לקודד גם בסמארטפון:
https://youtu.be/Cmq3TrS3ccU
כלי קוד מבוססי אינטליגנציה מלאכותית:
https://youtu.be/3cVJxRka4yM
השוואה של 3 מודלי שפה LLMs במהירות יצירת קוד למטלה זהה:
https://youtu.be/_JS-LkBrsk8
יישום של תוכנה שפותחה כך, ללא כתיבת קוד:
https://youtu.be/lkom9ufvxD4
איך ChatGPT בניתוח קוד? (עברית)
https://youtu.be/Z46pqHFuKHs
רפליט הוא כלי קוד בינתי מתקדם יותר:
https://youtu.be/FrMy3Bq7TZA
מדריך מתחילים לתכנות עם Cursor AI:
https://youtu.be/ocMOZpuAMw4?long=yes
ומדריך לעבודה עם Windsurf:
https://youtu.be/4nCMdQadE08?long=yes
מהי שרשרת מחשבה בלמידת מכונה?
שרשרת מחשבה (Chain of thought ובקיצור COT) היא טכניקה חדישה יחסית, שפותחה בתחום הבינה המלאכותית, לפיה הבינה מתבקשת לא רק לענות על שאלה, אלא להסביר ולשתף בכל שלב, בצעדים או בשלבים לקראת ועד הפיתרון. מכאן גם תרגום נוסף ואולי אף מדויק יותר בעברית "חשיבה מדורגת".
אם נדמיין לרגע שאנחנו מלמדים ילד לפתור בעיה מורכבת, סביר שלא נגיד לו את התשובה הסופית מיד. במקום זאת, נעדיף להוביל אותו אל הפתרון, בצעדים קטנים, צעד אחרי צעד. וזה בדיוק מה שקורה כשמתקשרים עם מודלים של בינה מלאכותית בדרך של שרשרת החשיבה, או החשיבה המדורגת.
באופן דומה, אפשר להנחות את הצ'טבוט כבר בפרומפט, לתת הסבר בשלבים של דרך הפתרון או ההגעה לתשובה ולא רק את התשובה עצמה.
#איך זה עובד בפועל?
זה לא מסובך. במקום לשאול "מה התשובה?", אפשר לכתוב למודל "בוא נחשוב על זה צעד אחרי צעד" או "הסבר לי את תהליך החשיבה שלך". התוצאה די מפתיעה: המודל הממושמע מתחיל לפרק את הבעיה לחלקים קטנים יותר, מסביר כל שלב בדרך ומוביל בהדרגה אל הפתרון המלא.
לטכניקה הזו יש משמעות מיוחדת בעולם הפרומפטים. כשאנחנו כותבים פרומפט חכם, אנחנו למעשה מזמינים את המודל לשתף אותנו בתהליך החשיבה שלו, בדיוק כמו תלמיד שמראה את כל שלבי הפתרון במחברת המתמטיקה. במקום לקבל תשובה יבשה וסופית, אנחנו מקבלים הצצה מרתקת אל תוך "המוח" של הבינה המלאכותית.
ושוב - לא מדובר רק על חקירת מידע, אלא על חקר הבינה האנושית עצמה. בדרך הזו אנו יכולים לחייב את הבינה להיות מאורגנת יותר ואולי אף ליפול פחות לאותן הזיות (Hallucinations), פריטי מידע שקריים או מטעים שלרוב מוצגים כעובדה.
#מה היתרון בשיטה הזו?
היתרון הגדול של שיטת "שרשרת המחשבה" הוא כפול: לא זו בלבד שהיא משפרת משמעותית את הדיוק של התשובות, אלא שהיא גם הופכת את כל התהליך לשקוף יותר. כשאנו, בני האדם, שותפים לתהליך המחשבה המודרגת הזו, ההרגשה היא כמו להציץ מעבר לכתפו של מומחה בזמן שהוא עובד - אנו לא רק רואים את התוצאה הסופית, אלא יכולים להבין בדיוק איך הגיעו אליה.
ובעידן שבו בינה מלאכותית הופכת לחלק בלתי נפרד מחיינו, היכולת להבין את תהליך החשיבה של מודל שפה או כל מכונה בינתית שהיא, היא לא רק יתרון, כי אחרי שמתנסים בה, מבינים כמה היא לעתים הכרחית.
הנה שרשרת מחשבה:
https://youtu.be/Fp-ue4UCE3s
הסבר יפה של ה-Chain of Thought:
https://youtu.be/4Iwnx2cVqtE
כך תשלטו בהנחיות שרשרת, באנגלית Chain prompting:
https://youtu.be/B4MR8m7V17A?long=yes
פודקסט AI על הסבר מפורט יותר על החשיבה המדורגת:
https://youtu.be/uo6y8oDrW3U?long=yes
והסבר מפורט יותר על זה:
https://youtu.be/C_gf9KNScIo?long=yes
מהם מודלי שפה גדולים, או LLM?
מודל שפה גדול (LLM), קיצור של Large Language Model, הוא ה"מוח" שמפעיל צ'אטבוט עוצמתי, כמו הצ'אטבוט ChatGPT, המייצר תוכן לבקשת המשתמשים ועושה זאת באמצעות מודל השפה הגדול GPT-4 ואחרים.
את התוכן מייצר הצ'אטבוט מדאטה עצום, כמות מידע אדירה שנשאבה מהאינטרנט ובאמצעותה אימנו את מודל השפה שמפעיל אותו. מודלי השפה GPT-3 ו-GPT-4, למשל, הם שמפעילים את הצ'אטבוט הכי מפורסם ChatGPT.
יש שאומרים שמודל השפה בעצם הוא לא יותר ממחולל מילים סטטיסטי. הם צודקים אבל גם טועים. כי מודל שפה יכול לחשב מצוין הסתברות של הופעת מילים שונות בכל משפט וכך לייצר משפטים חדשים, מילה אחר מילה, בשפה שבה הוא אומן על ידי המפתחים שלו. אבל זו דוגמה בלבד ואפילו קצת מטעה. כי סטטיסטיקה זה לא הכל וכנראה לא לגמרי המהות של העניין. המוח של מודל השפה, האופן שבו הוא בנוי והתובנות והביצועים שהוא יכול לנפק, הם משמעותיים הרבה יותר.
מודל כזה הוא תת-תחום של למידה עמוקה ומבוסס על רשת עצבית מלאכותית הבנויה בצורה דומה למוח האנושי. הרשת הזו היא בעלת כמות אדירה של פרמטרים, לרוב מיליארדים. הפרמטרים הללו הם ערכים מספריים שמסייעים לאלגוריתם ללמוד.
עוד ביטוי לגודלו הגדול של המודל הוא באימון שלו על מאות מיליוני מילים, בכמויות ענק של טקסט לא מתויג, בשיטת למידה שאינה מסתמכת רק על דוגמאות אנושיות, או מה שנקרא "למידה בפיקוח-עצמי".
#איך זה בדיוק עובד?
נניח ששאלתם שאלה, מודל השפה הגדול מניח את נוסח השאלה על שולחן הטיפולים שלו ובודק בדאטה שלו, במידע העצום שהוא אגר והמיר לקוד מתמטי (ראו אח"כ בתגית" טוקנים"), מה המילה שהכי סביר (מבחינת הסתברות) שתתחיל את התשובה. ואז הוא בודק מה המילה עם ההסתברות הכי גבוהה להופיע אחריה וכך הלאה. זה ייתן לו את התשובה הסבירה ביותר לשאלה.
למה הכי סבירה ולא הכי טובה? - כי הסתברות היא לעולם לא מושלמת וזו בדיוק הסיבה להזיות שנקבל לא פעם ממנועי בינה מלאכותית. אגב, אם תבקשו ממנו לבדוק את תשובתו, כל LLM ימצא ויפרט את שגיאותיו וגם יציע לתקן את המענה שנתן ובתיקון זה כבר יהיה הרבה יותר טוב.
ה-LLM משתמש בייצוג מתמטי של שפה טבעית באמצעות הסתברויות. כל מדען נתונים יאשר שהבסיס של מודלי שפה הוא היכולת שלהם לחשב הסתברות לכל משפט בשפה שבה הם אומנו ומהיכולת הזו נובע חלק משמעותי ביכולת שלהם לייצר משפטים חדשים, מילה אחר מילה.
#מודלי השפה הגדולים והבינה הג'נרטיבית
מודל השפה הגדול הוא בעצם הבסיס למהפכת הבינה הגנרטיבית שפרצה לחיינו בשלהי 2022-תחילת 23. מודלי השפה הגדולים הללו מסמנים קפיצת דרך של ממש ולמעשה הכניסו אותנו עמוק אל תוך העתיד.
הייתה זו IBM שפיתחה את אחד ממודלי השפה הראשונים. הוא נקרא ווטסון, על שם תומאס ווטסון, מייסד IBM. יש גרסה שאומרת שהוא קיבל את שמו משמו משם העוזר של שרלוק הולמס, ווטסון. מודל כזה, ממש כמו אותו עוזר, תמיד מסייע בחקר ובתשובות שונות, כיום של רבים ואצל שרלוק, לצרכי החקירות של הבלש הנודע.
מצוידים במודלים החדשים, הצ'אטבוטים המרשימים, כמו Claude ו-ChatGPT, מסרבים להיות לכם לווטסון. במקום זאת הם מפותחים כך שיהיו המוח, כלומר השרלוק שלכם, כשאתם וכמה זה אירוני, בתפקיד הווטסון או העוזר שלהם... אבל גם הלקוחות.
מודל שפה הוא שמאפשר לנו לבקש ממנו לסכם טקסטים, לענות על שאלות, לצייר או בעצם לייצר תמונות ו"צילומים", לחבר שירים, ליצור סרטונים או לכתוב קוד.
אז מודלי שפה גדולים אפשרו את קפיצת הדרך המדהימה של מהפכת ה-AI. אמנם הם רחוקים מלהיות מושלמים לחלוטין ועדיין פה ושם מקלקלים את ההתפעלות עם ההזיות המוכרות האלה שלהם, עובדות שגויות, מידע לא רלוונטי או מופרך ואפילו עלבונות נדירים. ומה שלא פחות מרגיז לעתים הוא הביטחון המלא שבו הם כותבים או מדברים אותן, שזה בדיוק מה שהופך את חשיפת ההזיות ובדיות הללו לכל כך קשה ומסוכנת...
כיום, המודלים הללו הולכים ומאפשרים צמיחה של עולם חדש, עולם סוכני ה-AI. הם ממוקדים בביצוע משימות ספציפיות, תגובה לסביבה ועוד תכונות מבטיחות. הכירו אותם בתגית "סוכני AI".
הנה מה שעושים המודלים, מנועי השפה הגדולים (מתורגם):
https://youtu.be/X-AWdfSFCHQ
כך פורצת מלחמת עולם ה-AI הראשונה:
https://youtu.be/nJjuYTpHQEE
מהו LLM?
https://youtu.be/iR2O2GPbB0E
המודל השולט בינואר 2025 - DeepSeek R1 הסיני:
https://youtu.be/hupQ97Or3jw
השוואת הצ'טבוטים הטובים, מנועי השפה הגדולים בסוף 2024 (עברית):
https://youtu.be/NanvGTQeO-g
כך פועל מודל השפה הגדול LLM:
https://youtu.be/iR2O2GPbB0E
כך בנויים ופועלים מודלי השפה הגדולים:
https://youtu.be/5sLYAQS9sWQ
יש להם גם חסרונות:
https://youtu.be/Gf_sgim24pI
הסבר מעמיק על מודלים גדולים של שפה ומה שהם הובילו (עברית):
https://youtu.be/-NIsUKUnxhA?long=yes
ובאופן סטטיסטי - כך פועל LLM:
https://youtu.be/LPZh9BOjkQs?long=yes
![סטוריבורד](https://eureka.b-cdn.net/images/w400/4135578987.jpg)
סטוריבורד (StoryBoard) בקולנוע הוא תיאור של השוטים המתוכננים לצילום, לרוב כשהם מצויירים על גבי נייר, כמו בקומיקס. מדובר בלוח תכנון שביצירתו יוצרי סרטים מקילים ומשביחים את תהליך הפרה-פרודקשן של הסרט.
בסטוריבורד מתוארים הצילומים המתוכננים מראש, בצורה ויזואלית, כדי לתאר את צילומי הווידאו או הפילם המתוכננים, עוד לפני הצילום.
המטרה של הסטוריבורד, בעברית "לוח סיפור", היא להקל על הבמאי ועל בעלי המקצוע השונים, בתכנון של צילומי הסרט.
הסטורי בורד מאפשר להבין את הסרט כפי שייראה על ציר הזמן, תמונה אחרי תמונה. הוא מסייע להמחיש את הסיפור, שוט אחרי שוט.
בעזרת הסטורי בורד ניתן לבדוק ולבקר מראש ובקלות רבה יותר דברים כמו מה עובד בסיפור ומה לא, לסמן כמה זמן ייקח כל שוט בסרט, לבחון האם הזרימה בין השוטים עובדת היטב והאם החיתוכים בין השוטים עובדים נכון.
בתור ייצוג גרפי של האופן שבו הסרט יתפתח, צילום אחר צילום, ייתכן שיצירת סטוריבורד נראה כמו שלב נוסף ואולי מיותר בתהליך הכנת סרט קצר או סרטון, אבל מדובר בשלב שמומלץ לעשות מה שניתן כדי לא לדלג עליו.
מקור השם "סטורי בורד" מגיע מהנוהג שהיה באולפני האנימציה הגדולים של פעם, לתלות איורים של כל שוט ושוט בסרט, על גבי לוח גדול על קיר האולפן. האיורים הללו איפשרו לצוות להתייחס לתכנית-העל של הסרט והוא היווה מעין מתכון להכנתו.
הנה דוגמה קצרה לסטורי בורד (עברית):
https://youtu.be/Rz1E0O3PSSw
מה זה סטורי בורד?
https://youtu.be/bpZjnH9wA4k
איך הסטוריבורד עובד?
https://youtu.be/6aTnEanIXBk
דוגמה לסטורי בורד מומחז בווידאו (עברית):
https://youtu.be/udK6HLxpaJE
הדרכה כיצד לעשות סטורי בורד, גם אם אינכם ציירים:
https://youtu.be/ux_Em1lVsjI
ויצירת סטוריבורד באמצעות כלי AI בסגנון של "Black and white sketch drawing style":
https://youtu.be/MKOG__oIe1o
![וידאו AI](https://eureka.b-cdn.net/images/w400/53968036759.jpg)
כלי יצירת וידאו בעזרת בינה מלאכותית גנרטיבית מתפתחים במהירות אדירה. עד לא מזמן זו הייתה המהפכה הבאה של הבינה המלאכותית, אבל מהירות הפיתוח של הטכנולוגיה הזו, כמו כל תחום הבינה הגנרטיבית, היא בלתי נתפסת ולכן היא כבר כאן ולא עוצרת לרגע.
וכך, נוסקים מה שהיו שנה קודם סרטונים של 4-5 שניות באיכות תמונה בסיסית עד נמוכה והבנה בינונית למדי של הפרומפטים (ההנחיות הטקסטואליות שבהן מתאר המשתמש את התוצאה המבוקשת). בתוך שנה הם הפכו לסרטונים מעולים, באיכות תמונה מעולה, היצמדות להנחיות הפרומפט ומאפשרים לבקש זוויות צילום, סוגי שוטים, סוג או ז'אנר הסרט ועוד.
וגם קהילת הקוד הפתוח (ראו בתגית "קוד פתוח") לא טומנת ידה בצלחת. לעומת מודלים מסחריים סגורים ויקרים למשתמש, המודלים שלהם מאפשרים יצירת סרטונים בארכיטקטורה עם שקיפות וחדשנות וללא עלות, תוך אימוץ של טכנולוגיות AI מהחדשניות ביותר, גם בחינם להורדה והרצה על המחשב המשתמש וגם אונליין, בהגבלות בשל העלות שעולה לשתפן כך.
מדהים לחשוב שמה שבעבר צולם באלפי דולרים מינימום לשניה של סרט, נוצר עכשיו בכמה פקודות מקלדת, שמייצרות סרטונים שווי ערך להפקה מורכבת, יקרה, עתירת מקצוענות וכוח אדם, כשלא פעם ביצועי אפקטים מיוחדים ו-CGI, יקרים ומורכבים לצילום, מוחלפים במחי פקודת מקלדת פשוטה ודמיון מפותח של היוצרים.
היום הבינה המלאכותית יוצרת סרטונים מעולים וברמה מטורפת, אפילו על בסיס של תמונות סטילס (תמונות רגילות), שהועלו אליה ונוספה להם הנחייה שאומרת מה "עושים" האובייקטים שבתמונה כשהם "משתתפים בצילומים".
וזה בדיוק מה שמדאיג היום רבים בתעשיית הקולנוע. קשה להימלט מהמחשבה כמה ואילו מקצועות עומדים להיעלם בקרוב מהעולם, מהמסך, הגדול או הקטן. בצל הקדמה הזו עלולים כמה א.נשים לאבד את פרנסתם. החלפתם הצפויה בבינה מלאכותית תהיה כי היא זולה, יעילה, צייתנית וכזו שאף פעם לא חולה, לא עצובה ולא מאחרת, כי הילד שלה מרגיש לא טוב בבית...
אז לצד זה שהבינה המלאכותית מרגשת, תורמת ליצירתיות וגלומות בה אינספור אפשרויות בלתי נגמרות, היא טומנת בחובה גם איומים וסכנות לאנושות ולנו בני האדם. תעשיית הקולנוע כולה עלולה להיות מוחלפת בהדרגה במיליוני רובוטים שקוראים להם AI ואין להם אפילו גוף לחבוט בו. רק אינטליגנציה מלאכותית, שלא מרחמת ולא חומלת, כי היא עושה רק מה שאומרים לה. במקלדת, כן?
הפתרון, כי חייבים לדבר אופטימית שוטפת, הוא ללמוד את הכלים החדשים הללו. יידע כל מקצוען קולנוע שבמקום להיות מוחלף ב-AI, עדיף לדעת AI ולהשתלב בעולם החדש הזה.
הנה האינטגרטיבית שעושה את הכל מפרומפט קטן:
https://youtu.be/Aw1TQwkCLQs
מינימקס המטורפת בווידאו AI:
https://youtu.be/4QXCV_TYKZc?long=yes
מודל וידאו בינתי ישראלי (עברית):
https://youtu.be/CkpLiPWLcHo
אפשרויות הווידאו AI שהולכות ומתפתחות במהירות - הנה Neurawik:
https://youtu.be/1HVkzZiv82Q
סרטון AI שנוצר באמצעות Google Veo 2 המדהים:
https://youtu.be/25adlZRtUCo
האם מתקרב הסוף של עשיית סרטים רגילה? (עברית)
https://youtu.be/kx3H1jFHncY
דברים שרק AI יכול לעשות (ללא מילים):
https://youtu.be/f-Vbm-iQ_Xw
הדרכה ל-Image to Video שהופכת תמונה לסרטון וידאו (עברית):
https://youtu.be/mR3rN8vphC8
קליפ AI של שיר של הביטלס:
https://youtu.be/Z9MZdNrGbM4
כך יוצרים מתמונות בעזרת פרומפט וידאו AI בקלות עם Minimax (עברית):
https://youtu.be/F-gl4E5yo60
כך יוצרים לייב פורטרייט - דיוקן עם מחוות שלכם:
https://youtu.be/kM3KSrPrh9c
קליפ מתמונה:
https://youtu.be/yCczY9PNeao
קדימון AI מדומה לסרט מדע בדיוני שלא קיים. האם בקרוב הסרט?
https://youtu.be/oAIrJP4n5sQ
כך מחליפים פנים לדמויות וידאו, מה שנקרא Faceswap:
https://youtu.be/vVs0DZ8VyGQ
על סקיצה של ג'ון לנון שהושלמה 40 שנה אחרי מותו עם קליפ משולב דמויות AI:
https://youtu.be/APJAQoSCwuA?long=yes
Magic Hour AI - כלי שיוצר סרטונים עד 60 שניות, שזה הכי הרבה:
https://youtu.be/eSpuvmRhcPg?long=yes
KREA - מודל ליצירת סרטונים AI:
https://youtu.be/OBewafac0Xs?long=yes
MINIMAX - עוד מודל וידאו מדהים מסין:
https://youtu.be/7JZLLxV1AGc?long=yes
כלי וידאו שמייצר ישר סרטון רב-סצנות:
https://youtu.be/BCCUNiToo94?long=yes
כלי הווידאו המומלצים לתחילת 2025:
https://youtu.be/K04zRJ8Vl_s?long=yes
וכך מייצרים סרטי וידאו ארוכים ב-Canva תחילת 2025:
https://youtu.be/tWmVbn4rUd0?long=yes
![כלי קוד מבוססי AI](https://eureka.b-cdn.net/images/w400/53369965149.jpg)
מחשב מתכנת לבדו? - באופן מסוים כן. כי כלי קוד מבוססי בינה מלאכותית (AI-based code tools) מאפשרים לשלב את הרעיון או המומחיות האנושית עם היכולות של הבינה המלאכותית, כדי לפתח תוכנה ולעשות זאת ללא קידוד של המשתמש או באמצעות שיתוף פעולה בין המשתמש ל-AI.
קידוד מבוסס AI מתבסס על בינה מלאכותית ככותבת הקוד. כתיבת הקוד מתבססת על מודל שפה שאומן על נתוני דאטה עצומים ולמד קידוד.
המשתמש מאפיין את המוצר, אם זה אתר אינטרנט, תוכנה או אפליקציה לטלפון ומתאר אותו באמצעות פרומפט, הנחייה שהוא כותב לבינה היוצרת בלשון טבעית, כלומר שפה רגילה, שפת יום יום וללא צורך בידע בתכנות.
החיבור בין הרעיון והשכל האנושי ובין האינטליגנציה המלאכותית מאפשרים ניהול וביצוע משימות פיתוח, בשיתוף פעולה ועצמאות גם יחד.
באמצעות תכונות של AI מקודד ניתן לתאר ל-AI את המטרה, לקבל קוד, להנחות אותה כיצד להתקדם בפתרון בעיות או באגים בקוד ולהוביל ביחד לקוד איכותי ולמימוש הרעיון.
ה-AI המקודד מודע לפעולות המשתמש בזמן אמת ומציע יתרונות אדירים. הוא מסוגל לערוך קבצים מרובים במהירות אדירה, להציע פקודות, לזהות בעיות ולנפות באגים.
כלי הקוד המשובח "Windsurf AI", למשל, מפעיל סוכני AI מובנים, יחד עם מעין "טייסי משנה" מונעי בינה מלאכותית, שמטרתם להטעין את הקוד ולהפוך את הקידוד למהיר ואינטואיטיבי יותר.
בעצם, Windsurf ודומיו, דוגמת Cursor AI שהיה חלוץ הכלים הללו, הם מעין סביבת פיתוח (IDE) מהדור החדש, המשפרות את הפיתוח בעזרת אוטומציה חכמה ומציעות עריכת קוד בסביבה מרובת קבצים. וינדסרף עושה זאת, בין השאר, בעזרת כלי שנקרא Cascade ומצטיין במודעות עמוקה לקונטקסט, ההקשר הכל כך בסיסי ומרכזי בבינה המלאכותית היוצרת (Generative AI).
כלי נוסף וקל הרבה יותר הוא Websim AI, המאפשר לתאר אתר או אפליקציה, או סתם לתת שם דומיין מדומה, והיא יוצרת אותם. מכאן אפשר להנחות אותה בצעדים, איטרציות, מה שמאפשר לדייק אותה, לשפר, לשדרג ולבנות הלאה.
הנה כלי קוד מבוססי אינטליגנציה מלאכותית:
https://youtu.be/3cVJxRka4yM
השוואה של 3 מודלי שפה LLMs במהירות יצירת קוד למטלה זהה:
https://youtu.be/_JS-LkBrsk8
יישום של תוכנה שפותחה כך, ללא כתיבת קוד:
https://youtu.be/lkom9ufvxD4
Websim.ai הוא כלי קוד קל מאוד וקסם ללא תכנות:
https://youtu.be/HCw4jCbLgMY
איך ChatGPT בניתוח קוד? (עברית)
https://youtu.be/Z46pqHFuKHs
רפליט הוא כלי קוד בינתי מתקדם יותר:
https://youtu.be/FrMy3Bq7TZA
לקודד אפשר גם בסמארטפון:
https://youtu.be/Cmq3TrS3ccU
מדריך מתחילים לתכנות עם Cursor AI:
https://youtu.be/ocMOZpuAMw4?long=yes
ומדריך לעבודה עם Windsurf:
https://youtu.be/4nCMdQadE08?long=yes
![יצירת מוסיקה ב-AI](https://eureka.b-cdn.net/images/w400/8096604267.jpg)
המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.
הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:
1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.
2. ללמוד מהדאטה הזה איך הדברים נשמעים.
3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).
פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.
את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.
היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.
פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.
עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.
הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:
https://youtu.be/3_pxKK2wqvI
הבינה המוסיקלית המדהימה של Udio:
https://youtu.be/aQC0FI_asKY
המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:
https://youtu.be/dAq0YcOAB4k
ההבטחה של Fugatto של אנבידיה:
https://youtu.be/qj1Sp8He6e4
הדוגמאות של המודל הבא מ-Eleven labs:
https://youtu.be/WA4Aco4rnTA
טעם רע או אזהרה - הקליפ של Apple שמדגים את החשש של המוסיקאים דווקא מ-Ai:
https://youtu.be/ntjkwIXWtrc
תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:
https://youtu.be/Xfhulh3iyWQ
מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:
https://youtu.be/iQ6ITnYAIok
Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:
https://youtu.be/FSbXnOKBK40
Riffusion - הכלי החדש ליצירת מוסיקת AI (עברית):
https://youtu.be/c5_agjg-_Q4?long=yes
ההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:
https://youtu.be/cvRJ_izhs28?long=yes
ואיך עובדים עם סונו 4:
https://youtu.be/5zYHm35V998?long=yes
בינה מלאכותית יוצרת
![כלי קוד מבוססי AI](https://eureka.b-cdn.net/images/w400/53064707019.jpg)
בימי AI אלה, של פברואר 2025, נראה שאנו רואים את השינוי בכתיבת קוד בכלל ובתכנות של אפליקציות לסוגיהן בפרט.
וזה לא ממש תכנות, עם כתיבת קוד וחלוקה למסמכים שיוצרים תוכנה, אלא יותר תהליך של חשיבה וחלוקת הוראות. כולנו יכולים לחשוב על רעיון, לנסח אותו כפרומפט, אולי גם לדמיין ולצייר מסכים, להציגם ל-AI, לראות קוד ואת התוצאה, לאשר או להציע תיקונים, לשפר את המודל ולראות את התוצאה משתפרת.
גם אם זה נשמע בלתי אפשרי, זה בדיוק מה שהבינה היוצרת מאפשרת כיום, כמעט לכל אחד, כולל מי שלא למדו מעולם לקודד ולתכנת. אחד מגאוני ה-AI של הדור החדש, אנדריי קרפאטי (Andrej Karpathy), מסביר שכלי ה-GenAI משנים את אופן פיתוח התוכנה מהיסוד וקורא לזה “תכנות וייב” (Vibe Coding).
תכנות הווייב פירושו תכנות שלא בקוד אלא של מפתחים שמתרכזים ברעיונות הגדולים ונותנים ל-AI לטפל בשאר - מהקוד והאיטרציות (שפירושן שיפור וניסוי שוב ושוב), דרך הפרטים הטכניים, הטיפול בבסיס הנתונים (Database), ב-API ובהעלאת הכלי לאונליין (Deployment).
ומדובר בשינוי של כל החוקים שהכרנו. המעבר הזה מכתיבת הקוד לפתרון בעיות באמצעות חשיבה מדויקת ככל האפשר, הנחיות ל-AI, עיצוב מסכים והעלאתם כטיוטות עיצוב לבינה, כל אלו הם חלום שמתממש. משמעותם הפשוטה היא דמוקרטיזציה של עולם פיתוח התוכנה.
והאפשרויות החדשות הללו מאפשרות עכשיו גם לאנשים ללא רקע תכנותי או היכרות והבנה בקוד, להגשים את רעיונותיהם - על ידי יצירה של תוכנות מקוונות, אפליקציות או כלים שונים, באמצעות כלים בינתיים וטכנולוגיים, המופעלים על ידי אדם ולידו בינה מלאכותית, שמקבלת ומבצעת הוראות.
אז המרחק, שבעבר היה גדול מאוד, בין הרעיון למימושו, תלוי עכשיו במשתמש ורק בו. כלים רבים לקידוד מבוסס פרומפטים יש כיום והם משתכללים מיום ליום. המוח האנושי יידע להנפיק מהם גם שיפורים אישיים ומרהיבים לחיים המודרניים וגם כלים חדשים ומעולים לשימוש בעתיד.
הנה הארטיפקט של קלוד, שאחרי קידוד ניתן לשתף את יצירתכם ב-Publish לאחרים:
https://youtu.be/vUdNaAAc4FY
שיעור תכנות ללא תכנות בכלי Lovable:
https://youtu.be/gqsZGxuymTk?long=yes
Websim.ai הוא כלי קוד שמשלב את העיצוב בקידוד וניתן לתכנת בו ללא תכנות:
https://youtu.be/HCw4jCbLgMY
Replit הוא כלי שבו ניתן לקודד גם בסמארטפון:
https://youtu.be/Cmq3TrS3ccU
כלי קוד מבוססי אינטליגנציה מלאכותית:
https://youtu.be/3cVJxRka4yM
השוואה של 3 מודלי שפה LLMs במהירות יצירת קוד למטלה זהה:
https://youtu.be/_JS-LkBrsk8
יישום של תוכנה שפותחה כך, ללא כתיבת קוד:
https://youtu.be/lkom9ufvxD4
איך ChatGPT בניתוח קוד? (עברית)
https://youtu.be/Z46pqHFuKHs
רפליט הוא כלי קוד בינתי מתקדם יותר:
https://youtu.be/FrMy3Bq7TZA
מדריך מתחילים לתכנות עם Cursor AI:
https://youtu.be/ocMOZpuAMw4?long=yes
ומדריך לעבודה עם Windsurf:
https://youtu.be/4nCMdQadE08?long=yes
![שרשרת מחשבה](https://eureka.b-cdn.net/images/w400/51827581850.jpg)
שרשרת מחשבה (Chain of thought ובקיצור COT) היא טכניקה חדישה יחסית, שפותחה בתחום הבינה המלאכותית, לפיה הבינה מתבקשת לא רק לענות על שאלה, אלא להסביר ולשתף בכל שלב, בצעדים או בשלבים לקראת ועד הפיתרון. מכאן גם תרגום נוסף ואולי אף מדויק יותר בעברית "חשיבה מדורגת".
אם נדמיין לרגע שאנחנו מלמדים ילד לפתור בעיה מורכבת, סביר שלא נגיד לו את התשובה הסופית מיד. במקום זאת, נעדיף להוביל אותו אל הפתרון, בצעדים קטנים, צעד אחרי צעד. וזה בדיוק מה שקורה כשמתקשרים עם מודלים של בינה מלאכותית בדרך של שרשרת החשיבה, או החשיבה המדורגת.
באופן דומה, אפשר להנחות את הצ'טבוט כבר בפרומפט, לתת הסבר בשלבים של דרך הפתרון או ההגעה לתשובה ולא רק את התשובה עצמה.
#איך זה עובד בפועל?
זה לא מסובך. במקום לשאול "מה התשובה?", אפשר לכתוב למודל "בוא נחשוב על זה צעד אחרי צעד" או "הסבר לי את תהליך החשיבה שלך". התוצאה די מפתיעה: המודל הממושמע מתחיל לפרק את הבעיה לחלקים קטנים יותר, מסביר כל שלב בדרך ומוביל בהדרגה אל הפתרון המלא.
לטכניקה הזו יש משמעות מיוחדת בעולם הפרומפטים. כשאנחנו כותבים פרומפט חכם, אנחנו למעשה מזמינים את המודל לשתף אותנו בתהליך החשיבה שלו, בדיוק כמו תלמיד שמראה את כל שלבי הפתרון במחברת המתמטיקה. במקום לקבל תשובה יבשה וסופית, אנחנו מקבלים הצצה מרתקת אל תוך "המוח" של הבינה המלאכותית.
ושוב - לא מדובר רק על חקירת מידע, אלא על חקר הבינה האנושית עצמה. בדרך הזו אנו יכולים לחייב את הבינה להיות מאורגנת יותר ואולי אף ליפול פחות לאותן הזיות (Hallucinations), פריטי מידע שקריים או מטעים שלרוב מוצגים כעובדה.
#מה היתרון בשיטה הזו?
היתרון הגדול של שיטת "שרשרת המחשבה" הוא כפול: לא זו בלבד שהיא משפרת משמעותית את הדיוק של התשובות, אלא שהיא גם הופכת את כל התהליך לשקוף יותר. כשאנו, בני האדם, שותפים לתהליך המחשבה המודרגת הזו, ההרגשה היא כמו להציץ מעבר לכתפו של מומחה בזמן שהוא עובד - אנו לא רק רואים את התוצאה הסופית, אלא יכולים להבין בדיוק איך הגיעו אליה.
ובעידן שבו בינה מלאכותית הופכת לחלק בלתי נפרד מחיינו, היכולת להבין את תהליך החשיבה של מודל שפה או כל מכונה בינתית שהיא, היא לא רק יתרון, כי אחרי שמתנסים בה, מבינים כמה היא לעתים הכרחית.
הנה שרשרת מחשבה:
https://youtu.be/Fp-ue4UCE3s
הסבר יפה של ה-Chain of Thought:
https://youtu.be/4Iwnx2cVqtE
כך תשלטו בהנחיות שרשרת, באנגלית Chain prompting:
https://youtu.be/B4MR8m7V17A?long=yes
פודקסט AI על הסבר מפורט יותר על החשיבה המדורגת:
https://youtu.be/uo6y8oDrW3U?long=yes
והסבר מפורט יותר על זה:
https://youtu.be/C_gf9KNScIo?long=yes
![מודל שפה גדול](https://eureka.b-cdn.net/images/w400/53220794671.jpg)
מודל שפה גדול (LLM), קיצור של Large Language Model, הוא ה"מוח" שמפעיל צ'אטבוט עוצמתי, כמו הצ'אטבוט ChatGPT, המייצר תוכן לבקשת המשתמשים ועושה זאת באמצעות מודל השפה הגדול GPT-4 ואחרים.
את התוכן מייצר הצ'אטבוט מדאטה עצום, כמות מידע אדירה שנשאבה מהאינטרנט ובאמצעותה אימנו את מודל השפה שמפעיל אותו. מודלי השפה GPT-3 ו-GPT-4, למשל, הם שמפעילים את הצ'אטבוט הכי מפורסם ChatGPT.
יש שאומרים שמודל השפה בעצם הוא לא יותר ממחולל מילים סטטיסטי. הם צודקים אבל גם טועים. כי מודל שפה יכול לחשב מצוין הסתברות של הופעת מילים שונות בכל משפט וכך לייצר משפטים חדשים, מילה אחר מילה, בשפה שבה הוא אומן על ידי המפתחים שלו. אבל זו דוגמה בלבד ואפילו קצת מטעה. כי סטטיסטיקה זה לא הכל וכנראה לא לגמרי המהות של העניין. המוח של מודל השפה, האופן שבו הוא בנוי והתובנות והביצועים שהוא יכול לנפק, הם משמעותיים הרבה יותר.
מודל כזה הוא תת-תחום של למידה עמוקה ומבוסס על רשת עצבית מלאכותית הבנויה בצורה דומה למוח האנושי. הרשת הזו היא בעלת כמות אדירה של פרמטרים, לרוב מיליארדים. הפרמטרים הללו הם ערכים מספריים שמסייעים לאלגוריתם ללמוד.
עוד ביטוי לגודלו הגדול של המודל הוא באימון שלו על מאות מיליוני מילים, בכמויות ענק של טקסט לא מתויג, בשיטת למידה שאינה מסתמכת רק על דוגמאות אנושיות, או מה שנקרא "למידה בפיקוח-עצמי".
#איך זה בדיוק עובד?
נניח ששאלתם שאלה, מודל השפה הגדול מניח את נוסח השאלה על שולחן הטיפולים שלו ובודק בדאטה שלו, במידע העצום שהוא אגר והמיר לקוד מתמטי (ראו אח"כ בתגית" טוקנים"), מה המילה שהכי סביר (מבחינת הסתברות) שתתחיל את התשובה. ואז הוא בודק מה המילה עם ההסתברות הכי גבוהה להופיע אחריה וכך הלאה. זה ייתן לו את התשובה הסבירה ביותר לשאלה.
למה הכי סבירה ולא הכי טובה? - כי הסתברות היא לעולם לא מושלמת וזו בדיוק הסיבה להזיות שנקבל לא פעם ממנועי בינה מלאכותית. אגב, אם תבקשו ממנו לבדוק את תשובתו, כל LLM ימצא ויפרט את שגיאותיו וגם יציע לתקן את המענה שנתן ובתיקון זה כבר יהיה הרבה יותר טוב.
ה-LLM משתמש בייצוג מתמטי של שפה טבעית באמצעות הסתברויות. כל מדען נתונים יאשר שהבסיס של מודלי שפה הוא היכולת שלהם לחשב הסתברות לכל משפט בשפה שבה הם אומנו ומהיכולת הזו נובע חלק משמעותי ביכולת שלהם לייצר משפטים חדשים, מילה אחר מילה.
#מודלי השפה הגדולים והבינה הג'נרטיבית
מודל השפה הגדול הוא בעצם הבסיס למהפכת הבינה הגנרטיבית שפרצה לחיינו בשלהי 2022-תחילת 23. מודלי השפה הגדולים הללו מסמנים קפיצת דרך של ממש ולמעשה הכניסו אותנו עמוק אל תוך העתיד.
הייתה זו IBM שפיתחה את אחד ממודלי השפה הראשונים. הוא נקרא ווטסון, על שם תומאס ווטסון, מייסד IBM. יש גרסה שאומרת שהוא קיבל את שמו משמו משם העוזר של שרלוק הולמס, ווטסון. מודל כזה, ממש כמו אותו עוזר, תמיד מסייע בחקר ובתשובות שונות, כיום של רבים ואצל שרלוק, לצרכי החקירות של הבלש הנודע.
מצוידים במודלים החדשים, הצ'אטבוטים המרשימים, כמו Claude ו-ChatGPT, מסרבים להיות לכם לווטסון. במקום זאת הם מפותחים כך שיהיו המוח, כלומר השרלוק שלכם, כשאתם וכמה זה אירוני, בתפקיד הווטסון או העוזר שלהם... אבל גם הלקוחות.
מודל שפה הוא שמאפשר לנו לבקש ממנו לסכם טקסטים, לענות על שאלות, לצייר או בעצם לייצר תמונות ו"צילומים", לחבר שירים, ליצור סרטונים או לכתוב קוד.
אז מודלי שפה גדולים אפשרו את קפיצת הדרך המדהימה של מהפכת ה-AI. אמנם הם רחוקים מלהיות מושלמים לחלוטין ועדיין פה ושם מקלקלים את ההתפעלות עם ההזיות המוכרות האלה שלהם, עובדות שגויות, מידע לא רלוונטי או מופרך ואפילו עלבונות נדירים. ומה שלא פחות מרגיז לעתים הוא הביטחון המלא שבו הם כותבים או מדברים אותן, שזה בדיוק מה שהופך את חשיפת ההזיות ובדיות הללו לכל כך קשה ומסוכנת...
כיום, המודלים הללו הולכים ומאפשרים צמיחה של עולם חדש, עולם סוכני ה-AI. הם ממוקדים בביצוע משימות ספציפיות, תגובה לסביבה ועוד תכונות מבטיחות. הכירו אותם בתגית "סוכני AI".
הנה מה שעושים המודלים, מנועי השפה הגדולים (מתורגם):
https://youtu.be/X-AWdfSFCHQ
כך פורצת מלחמת עולם ה-AI הראשונה:
https://youtu.be/nJjuYTpHQEE
מהו LLM?
https://youtu.be/iR2O2GPbB0E
המודל השולט בינואר 2025 - DeepSeek R1 הסיני:
https://youtu.be/hupQ97Or3jw
השוואת הצ'טבוטים הטובים, מנועי השפה הגדולים בסוף 2024 (עברית):
https://youtu.be/NanvGTQeO-g
כך פועל מודל השפה הגדול LLM:
https://youtu.be/iR2O2GPbB0E
כך בנויים ופועלים מודלי השפה הגדולים:
https://youtu.be/5sLYAQS9sWQ
יש להם גם חסרונות:
https://youtu.be/Gf_sgim24pI
הסבר מעמיק על מודלים גדולים של שפה ומה שהם הובילו (עברית):
https://youtu.be/-NIsUKUnxhA?long=yes
ובאופן סטטיסטי - כך פועל LLM:
https://youtu.be/LPZh9BOjkQs?long=yes
![](/css/images/photo10.png)