שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.
»
«
מהי המוסיקה שיוצר ה-AI?
המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.
הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:
1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.
2. ללמוד מהדאטה הזה איך הדברים נשמעים.
3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).
פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.
את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.
היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.
פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.
עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.
הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:
https://youtu.be/3_pxKK2wqvI
הבינה המוסיקלית המדהימה של Udio:
https://youtu.be/aQC0FI_asKY
המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:
https://youtu.be/dAq0YcOAB4k
ההבטחה של Fugatto של אנבידיה:
https://youtu.be/qj1Sp8He6e4
הדוגמאות של המודל הבא מ-Eleven labs:
https://youtu.be/WA4Aco4rnTA
טעם רע או אזהרה - הקליפ של Apple שמדגים את החשש של המוסיקאים דווקא מ-Ai:
https://youtu.be/ntjkwIXWtrc
תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:
https://youtu.be/Xfhulh3iyWQ
מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:
https://youtu.be/iQ6ITnYAIok
Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:
https://youtu.be/FSbXnOKBK40
ההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:
https://youtu.be/cvRJ_izhs28?long=yes
ואיך עובדים עם סונו 4:
https://youtu.be/5zYHm35V998?long=yes
המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.
הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:
1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.
2. ללמוד מהדאטה הזה איך הדברים נשמעים.
3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).
פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.
את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.
היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.
פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.
עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.
הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:
https://youtu.be/3_pxKK2wqvI
הבינה המוסיקלית המדהימה של Udio:
https://youtu.be/aQC0FI_asKY
המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:
https://youtu.be/dAq0YcOAB4k
ההבטחה של Fugatto של אנבידיה:
https://youtu.be/qj1Sp8He6e4
הדוגמאות של המודל הבא מ-Eleven labs:
https://youtu.be/WA4Aco4rnTA
טעם רע או אזהרה - הקליפ של Apple שמדגים את החשש של המוסיקאים דווקא מ-Ai:
https://youtu.be/ntjkwIXWtrc
תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:
https://youtu.be/Xfhulh3iyWQ
מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:
https://youtu.be/iQ6ITnYAIok
Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:
https://youtu.be/FSbXnOKBK40
ההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:
https://youtu.be/cvRJ_izhs28?long=yes
ואיך עובדים עם סונו 4:
https://youtu.be/5zYHm35V998?long=yes
מהם מנועי ציור ויזואליים כמו Dall-e ומידג'רני?
הבינה המלאכותית (AI) DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.
הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצר AI, לצייר, צלם ועוד כל מיני אמנים - אבל באינטליגנציה מלאכותית.
באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימיבייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ולא פעם אף מדהימים.
ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.
להישג המקורי של DALL-E וגרסתה המשופרת DALL-E 2, תוצר של חברת OpenAI, קמו די מהר מתחרים ראויים נוספים ואיכותיים לא פחות, המייצרים עולם חדש וחסר תקדים של ציירים מכניים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.
איש לא יודע בדיוק כיצד DALL-E פועל, גם לא היוצרים של המודלים שלפיהם הוא פועל. אבל זו העבודה המדהימה של הלמידה העמוקה שמעבדת בעצמה את הדאטה ממיליוני התמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.
התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית וחוץ מתחרות של חברות וקוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין.
הנה כלי Gen AI מצטיין ליצירה ויזואלית Ideogram.ai:
https://youtu.be/XZjaHJP0PQE
"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:
https://youtu.be/qTgPSKKjfVg
כתבה על היכולת המופלאה של דאלי 2 ליצור אמנות:
https://youtu.be/hiSgpZUAy2c
הסבר אמנות ה-AI:
https://youtu.be/alJdw4JDJ4o
מנועי יצירת תמונות מתחרים ומקבילים ל-DALL-E:
https://youtu.be/rGbNJrywLhk
גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):
https://youtu.be/KR29znIp2LU
ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:
https://youtu.be/G-Wsh1vUeVQ
מדריך להרחבת תמונות:
https://youtu.be/V1KLG159A2s
קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:
https://youtu.be/VR3AWdyVVdU
למה יש לבינה כל הזמן בעיה עם אצבעות?
https://youtu.be/24yjRbBah3w
גם למחוללי בינה כמו מידג'רני יש בעיות (עברית):
https://youtu.be/xUpUhHsAWlg?long=yes
ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:
https://youtu.be/FRClNMC_z-s?long=yes
הבינה המלאכותית (AI) DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.
הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצר AI, לצייר, צלם ועוד כל מיני אמנים - אבל באינטליגנציה מלאכותית.
באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימיבייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ולא פעם אף מדהימים.
ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.
להישג המקורי של DALL-E וגרסתה המשופרת DALL-E 2, תוצר של חברת OpenAI, קמו די מהר מתחרים ראויים נוספים ואיכותיים לא פחות, המייצרים עולם חדש וחסר תקדים של ציירים מכניים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.
איש לא יודע בדיוק כיצד DALL-E פועל, גם לא היוצרים של המודלים שלפיהם הוא פועל. אבל זו העבודה המדהימה של הלמידה העמוקה שמעבדת בעצמה את הדאטה ממיליוני התמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.
התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית וחוץ מתחרות של חברות וקוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין.
הנה כלי Gen AI מצטיין ליצירה ויזואלית Ideogram.ai:
https://youtu.be/XZjaHJP0PQE
"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:
https://youtu.be/qTgPSKKjfVg
כתבה על היכולת המופלאה של דאלי 2 ליצור אמנות:
https://youtu.be/hiSgpZUAy2c
הסבר אמנות ה-AI:
https://youtu.be/alJdw4JDJ4o
מנועי יצירת תמונות מתחרים ומקבילים ל-DALL-E:
https://youtu.be/rGbNJrywLhk
גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):
https://youtu.be/KR29znIp2LU
ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:
https://youtu.be/G-Wsh1vUeVQ
מדריך להרחבת תמונות:
https://youtu.be/V1KLG159A2s
קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:
https://youtu.be/VR3AWdyVVdU
למה יש לבינה כל הזמן בעיה עם אצבעות?
https://youtu.be/24yjRbBah3w
גם למחוללי בינה כמו מידג'רני יש בעיות (עברית):
https://youtu.be/xUpUhHsAWlg?long=yes
ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:
https://youtu.be/FRClNMC_z-s?long=yes
מהי בינה מלאכותית גנרטיבית?
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון עצום של תוכן חדש. התוכן הזה משתרע על מגוון תחומים גדול, שהולך ומתפתח מיום ליום ובשימוש בצורת כלי איי, כלים שמאפשרים לייצר תכנים ותוצרים באופן מקוון, או בהתקנה על המחשב.
התוכן שבינה גנרטיבית יודעת לייצר כולל החל מטקסטים, דרך תמונות, סרטונים, מוסיקה, אנימציה ומגוון אדיר של סוגי מדיה ויישומים נוספים. ביניהם נכללים כתיבת קוד, עיצוב גרפי, תכניות באינספור תחומים, ניסוחי מכתבים, מאמרים וספרים ועוד.
בבסיסה, יודעת הבינה המלאכותית לעשות 3 דברים:
1. לקבל דאטה, כלומר נתונים מסוג כלשהו.
2. ללמוד מהדאטה הזה על הסוג.
3. לייצר לבקשת המשתמש תוצרים חדשים מסוג זה.
התקשורת בין המשתמש למודל השפה של בינה הגנרטיבית (LLM) מתבצעת כיום באמצעות כתיבה של פרומפט (Prompt), שהיא הנחייה מילולית בשפה טבעית, השפה הרגילה שלנו, כולל אנגלית, עברית וכדומה.
לפרומפטים הללו מתווספים כבר היום ממשקי משתמש נוספים, נוחים, קלים ולרוב גם יעילים יותר. ביניהם אנו מוצאים תפריטים, כפתורים על המסך, תגיות, בחירת אפשרויות בכפתורי רדיו, קופסאות סימון וכדומה. כיום נכנס גם הממשק הקולי בו המשתמש משוחח או פוקד על מודל השפה וההוראות מתורגמות מקול לטקסט, על ידי ה-AI, ומבוצעות מיד.
ההתחלה, אגב, של פיתוח המודלים הללו הייתה צנועה למדי. היא התבטאה בהכנסת קובץ סאונד כמו MP3 למערכת הבינה וקבלת התמלול שלו כטקסט כתוב. בהמשך הפיתוח הלכו השימושים בהם וגדלו, נעשו מורכבים ומדהימים יותר ויותר וכיום הבינה הגנרטיבית היא מפותחת להפליא.
בעיני רבים הבינה הגנרטיבית מאיימת כיום להחליף אנשים בעבודות שהם עושים. מומחים טוענים שזה לא מדויק ושמה שיוחלף הם תהליכי העבודה. לטענתם, תמיד יידרש המרכיב האנושי שיוודא שהשימוש בבינה המלאכותית ובמיוחד היצירתית, יהיה מוצלח.
אז כדי שיוכלו להמשיך לעבוד, העובדים יצטרכו להתעדכן, ללמוד ולהצטייד ביכולות חדשות, שיותאמו לדרישות החדשות של המעסיקים. קראו על כך בתגית "בינה מלאכותית גנרטיבית, אבטלה".
הנה הסבר על הבינה הגנרטיבית:
https://youtu.be/vneJieU5qlg
היכולות המטורפות של הבינה המלאכותית הגנרטיבית (עברית):
https://youtu.be/05oOucZmO8Y
התפתחות התחום הגנרטיבי כפי שהוא מוצג לאחת מאלפי חברות Generative AI (עברית):
https://youtu.be/joJVqKTPVsY
מהי בינה גנרטיבית?
https://youtu.be/pWNAtUwnBS8
משמעות ה-AI הגנרטיבי בעולם הכתיבה העיתונאית:
https://youtu.be/3Jopz-V-IRQ
כך מייצרים וידאו באחד הכלים הג'נרטיביים:
https://youtu.be/hh_mnplMtbE?long=yes
וסקירה מקיפה על הבינה המלאכותית הג'נרטיבית:
https://youtu.be/2IK3DFHRFfw?long=yes
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון עצום של תוכן חדש. התוכן הזה משתרע על מגוון תחומים גדול, שהולך ומתפתח מיום ליום ובשימוש בצורת כלי איי, כלים שמאפשרים לייצר תכנים ותוצרים באופן מקוון, או בהתקנה על המחשב.
התוכן שבינה גנרטיבית יודעת לייצר כולל החל מטקסטים, דרך תמונות, סרטונים, מוסיקה, אנימציה ומגוון אדיר של סוגי מדיה ויישומים נוספים. ביניהם נכללים כתיבת קוד, עיצוב גרפי, תכניות באינספור תחומים, ניסוחי מכתבים, מאמרים וספרים ועוד.
בבסיסה, יודעת הבינה המלאכותית לעשות 3 דברים:
1. לקבל דאטה, כלומר נתונים מסוג כלשהו.
2. ללמוד מהדאטה הזה על הסוג.
3. לייצר לבקשת המשתמש תוצרים חדשים מסוג זה.
התקשורת בין המשתמש למודל השפה של בינה הגנרטיבית (LLM) מתבצעת כיום באמצעות כתיבה של פרומפט (Prompt), שהיא הנחייה מילולית בשפה טבעית, השפה הרגילה שלנו, כולל אנגלית, עברית וכדומה.
לפרומפטים הללו מתווספים כבר היום ממשקי משתמש נוספים, נוחים, קלים ולרוב גם יעילים יותר. ביניהם אנו מוצאים תפריטים, כפתורים על המסך, תגיות, בחירת אפשרויות בכפתורי רדיו, קופסאות סימון וכדומה. כיום נכנס גם הממשק הקולי בו המשתמש משוחח או פוקד על מודל השפה וההוראות מתורגמות מקול לטקסט, על ידי ה-AI, ומבוצעות מיד.
ההתחלה, אגב, של פיתוח המודלים הללו הייתה צנועה למדי. היא התבטאה בהכנסת קובץ סאונד כמו MP3 למערכת הבינה וקבלת התמלול שלו כטקסט כתוב. בהמשך הפיתוח הלכו השימושים בהם וגדלו, נעשו מורכבים ומדהימים יותר ויותר וכיום הבינה הגנרטיבית היא מפותחת להפליא.
בעיני רבים הבינה הגנרטיבית מאיימת כיום להחליף אנשים בעבודות שהם עושים. מומחים טוענים שזה לא מדויק ושמה שיוחלף הם תהליכי העבודה. לטענתם, תמיד יידרש המרכיב האנושי שיוודא שהשימוש בבינה המלאכותית ובמיוחד היצירתית, יהיה מוצלח.
אז כדי שיוכלו להמשיך לעבוד, העובדים יצטרכו להתעדכן, ללמוד ולהצטייד ביכולות חדשות, שיותאמו לדרישות החדשות של המעסיקים. קראו על כך בתגית "בינה מלאכותית גנרטיבית, אבטלה".
הנה הסבר על הבינה הגנרטיבית:
https://youtu.be/vneJieU5qlg
היכולות המטורפות של הבינה המלאכותית הגנרטיבית (עברית):
https://youtu.be/05oOucZmO8Y
התפתחות התחום הגנרטיבי כפי שהוא מוצג לאחת מאלפי חברות Generative AI (עברית):
https://youtu.be/joJVqKTPVsY
מהי בינה גנרטיבית?
https://youtu.be/pWNAtUwnBS8
משמעות ה-AI הגנרטיבי בעולם הכתיבה העיתונאית:
https://youtu.be/3Jopz-V-IRQ
כך מייצרים וידאו באחד הכלים הג'נרטיביים:
https://youtu.be/hh_mnplMtbE?long=yes
וסקירה מקיפה על הבינה המלאכותית הג'נרטיבית:
https://youtu.be/2IK3DFHRFfw?long=yes
מה עושה הפרומפט בעולם הבינה המלאכותית הגנרטיבית?
מהו המקביל של מברשת של הצייר, מקלדת המלחין או הבוס של כותב המאמר, עורך הווידאו או המשורר בעולם הבינה המלאכותית הגנרטיבית? - מיהו זה שאומר מה הוא צריך והם יושבים לעבוד וליצור?
זהו הפרומפט (Prompt), ההנחייה הטקסטואלית שאנחנו נותנים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו תוצר בינתי.
בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצר שרוצים לקבל מהבינה.
היום הפרומפט הוא המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.
זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.
#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.
יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.
#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:
פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:
ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח. אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, הציבו גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".
שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה. זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.
בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').
הסבר כמו למתחיל - בקשו בפרומפט כך:
"Explain [subject] in simple terms. Explain to me as if I'm a beginner."
כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):
https://youtu.be/joJVqKTPVsY
השיעור הראשון בניסוח הפרומפט:
https://youtu.be/Qos2rG3zVAM
איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):
https://youtu.be/zFS7WtovYmo
יש תוכנה לעזרה בניסוח פרומפטים (עברית):
https://youtu.be/HLhRFaXQ0vQ
על הפרומפט שמייצר חדשות קוליות לגיק:
https://youtu.be/5TlsXXTamBs
מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:
https://youtu.be/pZsJbYIFCCw
הנה מקצוע מהנדס הפרומפט:
https://youtu.be/Bq-ncjOGeVU
והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:
https://youtu.be/hd7l9F3n4ZM?long=yes
מהו המקביל של מברשת של הצייר, מקלדת המלחין או הבוס של כותב המאמר, עורך הווידאו או המשורר בעולם הבינה המלאכותית הגנרטיבית? - מיהו זה שאומר מה הוא צריך והם יושבים לעבוד וליצור?
זהו הפרומפט (Prompt), ההנחייה הטקסטואלית שאנחנו נותנים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו תוצר בינתי.
בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצר שרוצים לקבל מהבינה.
היום הפרומפט הוא המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.
זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.
#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.
יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.
#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:
פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:
ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח. אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, הציבו גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".
שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה. זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.
בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').
הסבר כמו למתחיל - בקשו בפרומפט כך:
"Explain [subject] in simple terms. Explain to me as if I'm a beginner."
כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):
https://youtu.be/joJVqKTPVsY
השיעור הראשון בניסוח הפרומפט:
https://youtu.be/Qos2rG3zVAM
איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):
https://youtu.be/zFS7WtovYmo
יש תוכנה לעזרה בניסוח פרומפטים (עברית):
https://youtu.be/HLhRFaXQ0vQ
על הפרומפט שמייצר חדשות קוליות לגיק:
https://youtu.be/5TlsXXTamBs
מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:
https://youtu.be/pZsJbYIFCCw
הנה מקצוע מהנדס הפרומפט:
https://youtu.be/Bq-ncjOGeVU
והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:
https://youtu.be/hd7l9F3n4ZM?long=yes
GenAI
מה זה סטוריבורד?
סטוריבורד (StoryBoard) בקולנוע הוא תיאור של השוטים המתוכננים לצילום, לרוב כשהם מצויירים על גבי נייר, כמו בקומיקס. מדובר בלוח תכנון שביצירתו יוצרי סרטים מקילים ומשביחים את תהליך הפרה-פרודקשן של הסרט.
בסטוריבורד מתוארים הצילומים המתוכננים מראש, בצורה ויזואלית, כדי לתאר את צילומי הווידאו או הפילם המתוכננים, עוד לפני הצילום.
המטרה של הסטוריבורד, בעברית "לוח סיפור", היא להקל על הבמאי ועל בעלי המקצוע השונים, בתכנון של צילומי הסרט.
הסטורי בורד מאפשר להבין את הסרט כפי שייראה על ציר הזמן, תמונה אחרי תמונה. הוא מסייע להמחיש את הסיפור, שוט אחרי שוט.
בעזרת הסטורי בורד ניתן לבדוק ולבקר מראש ובקלות רבה יותר דברים כמו מה עובד בסיפור ומה לא, לסמן כמה זמן ייקח כל שוט בסרט, לבחון האם הזרימה בין השוטים עובדת היטב והאם החיתוכים בין השוטים עובדים נכון.
בתור ייצוג גרפי של האופן שבו הסרט יתפתח, צילום אחר צילום, ייתכן שיצירת סטוריבורד נראה כמו שלב נוסף ואולי מיותר בתהליך הכנת סרט קצר או סרטון, אבל מדובר בשלב שמומלץ לעשות מה שניתן כדי לא לדלג עליו.
מקור השם "סטורי בורד" מגיע מהנוהג שהיה באולפני האנימציה הגדולים של פעם, לתלות איורים של כל שוט ושוט בסרט, על גבי לוח גדול על קיר האולפן. האיורים הללו איפשרו לצוות להתייחס לתכנית-העל של הסרט והוא היווה מעין מתכון להכנתו.
הנה דוגמה קצרה לסטורי בורד (עברית):
https://youtu.be/Rz1E0O3PSSw
מה זה סטורי בורד?
https://youtu.be/bpZjnH9wA4k
איך הסטוריבורד עובד?
https://youtu.be/6aTnEanIXBk
דוגמה לסטורי בורד מומחז בווידאו (עברית):
https://youtu.be/udK6HLxpaJE
הדרכה כיצד לעשות סטורי בורד, גם אם אינכם ציירים:
https://youtu.be/ux_Em1lVsjI
ויצירת סטוריבורד באמצעות כלי AI בסגנון של "Black and white sketch drawing style":
https://youtu.be/MKOG__oIe1o
סטוריבורד (StoryBoard) בקולנוע הוא תיאור של השוטים המתוכננים לצילום, לרוב כשהם מצויירים על גבי נייר, כמו בקומיקס. מדובר בלוח תכנון שביצירתו יוצרי סרטים מקילים ומשביחים את תהליך הפרה-פרודקשן של הסרט.
בסטוריבורד מתוארים הצילומים המתוכננים מראש, בצורה ויזואלית, כדי לתאר את צילומי הווידאו או הפילם המתוכננים, עוד לפני הצילום.
המטרה של הסטוריבורד, בעברית "לוח סיפור", היא להקל על הבמאי ועל בעלי המקצוע השונים, בתכנון של צילומי הסרט.
הסטורי בורד מאפשר להבין את הסרט כפי שייראה על ציר הזמן, תמונה אחרי תמונה. הוא מסייע להמחיש את הסיפור, שוט אחרי שוט.
בעזרת הסטורי בורד ניתן לבדוק ולבקר מראש ובקלות רבה יותר דברים כמו מה עובד בסיפור ומה לא, לסמן כמה זמן ייקח כל שוט בסרט, לבחון האם הזרימה בין השוטים עובדת היטב והאם החיתוכים בין השוטים עובדים נכון.
בתור ייצוג גרפי של האופן שבו הסרט יתפתח, צילום אחר צילום, ייתכן שיצירת סטוריבורד נראה כמו שלב נוסף ואולי מיותר בתהליך הכנת סרט קצר או סרטון, אבל מדובר בשלב שמומלץ לעשות מה שניתן כדי לא לדלג עליו.
מקור השם "סטורי בורד" מגיע מהנוהג שהיה באולפני האנימציה הגדולים של פעם, לתלות איורים של כל שוט ושוט בסרט, על גבי לוח גדול על קיר האולפן. האיורים הללו איפשרו לצוות להתייחס לתכנית-העל של הסרט והוא היווה מעין מתכון להכנתו.
הנה דוגמה קצרה לסטורי בורד (עברית):
https://youtu.be/Rz1E0O3PSSw
מה זה סטורי בורד?
https://youtu.be/bpZjnH9wA4k
איך הסטוריבורד עובד?
https://youtu.be/6aTnEanIXBk
דוגמה לסטורי בורד מומחז בווידאו (עברית):
https://youtu.be/udK6HLxpaJE
הדרכה כיצד לעשות סטורי בורד, גם אם אינכם ציירים:
https://youtu.be/ux_Em1lVsjI
ויצירת סטוריבורד באמצעות כלי AI בסגנון של "Black and white sketch drawing style":
https://youtu.be/MKOG__oIe1o
איך יוצרים סרטים וסרטונים באמצעות AI?
כלי יצירת וידאו בעזרת בינה מלאכותית גנרטיבית מתפתחים במהירות אדירה. עד לא מזמן זו הייתה המהפכה הבאה של הבינה המלאכותית, אבל מהירות הפיתוח של הטכנולוגיה הזו, כמו כל תחום הבינה הגנרטיבית, היא בלתי נתפסת ולכן היא כבר כאן ולא עוצרת לרגע.
וכך, נוסקים מה שהיו שנה קודם סרטונים של 4-5 שניות באיכות תמונה בסיסית עד נמוכה והבנה בינונית למדי של הפרומפטים (ההנחיות הטקסטואליות שבהן מתאר המשתמש את התוצאה המבוקשת). בתוך שנה הם הפכו לסרטונים מעולים, באיכות תמונה מעולה, היצמדות להנחיות הפרומפט ומאפשרים לבקש זוויות צילום, סוגי שוטים, סוג או ז'אנר הסרט ועוד.
וגם קהילת הקוד הפתוח (ראו בתגית "קוד פתוח") לא טומנת ידה בצלחת. לעומת מודלים מסחריים סגורים ויקרים למשתמש, המודלים שלהם מאפשרים יצירת סרטונים בארכיטקטורה עם שקיפות וחדשנות וללא עלות, תוך אימוץ של טכנולוגיות AI מהחדשניות ביותר, גם בחינם להורדה והרצה על המחשב המשתמש וגם אונליין, בהגבלות בשל העלות שעולה לשתפן כך.
מדהים לחשוב שמה שבעבר צולם באלפי דולרים מינימום לשניה של סרט, נוצר עכשיו בכמה פקודות מקלדת, שמייצרות סרטונים שווי ערך להפקה מורכבת, יקרה, עתירת מקצוענות וכוח אדם, כשלא פעם ביצועי אפקטים מיוחדים ו-CGI, יקרים ומורכבים לצילום, מוחלפים במחי פקודת מקלדת פשוטה ודמיון מפותח של היוצרים.
היום הבינה המלאכותית יוצרת סרטונים מעולים וברמה מטורפת, אפילו על בסיס של תמונות סטילס (תמונות רגילות), שהועלו אליה ונוספה להם הנחייה שאומרת מה "עושים" האובייקטים שבתמונה כשהם "משתתפים בצילומים".
וזה בדיוק מה שמדאיג היום רבים בתעשיית הקולנוע. קשה להימלט מהמחשבה כמה ואילו מקצועות עומדים להיעלם בקרוב מהעולם, מהמסך, הגדול או הקטן. בצל הקדמה הזו עלולים כמה א.נשים לאבד את פרנסתם. החלפתם הצפויה בבינה מלאכותית תהיה כי היא זולה, יעילה, צייתנית וכזו שאף פעם לא חולה, לא עצובה ולא מאחרת, כי הילד שלה מרגיש לא טוב בבית...
אז לצד זה שהבינה המלאכותית מרגשת, תורמת ליצירתיות וגלומות בה אינספור אפשרויות בלתי נגמרות, היא טומנת בחובה גם איומים וסכנות לאנושות ולנו בני האדם. תעשיית הקולנוע כולה עלולה להיות מוחלפת בהדרגה במיליוני רובוטים שקוראים להם AI ואין להם אפילו גוף לחבוט בו. רק אינטליגנציה מלאכותית, שלא מרחמת ולא חומלת, כי היא עושה רק מה שאומרים לה. במקלדת, כן?
הפתרון, כי חייבים לדבר אופטימית שוטפת, הוא ללמוד את הכלים החדשים הללו. יידע כל מקצוען קולנוע שבמקום להיות מוחלף ב-AI, עדיף לדעת AI ולהשתלב בעולם החדש הזה.
הנה מודל וידאו בינתי ישראלי (עברית):
https://youtu.be/CkpLiPWLcHo
אפשרויות הווידאו AI שהולכות ומתפתחות במהירות:
https://youtu.be/1HVkzZiv82Q
האם מתקרב הסוף של עשיית סרטים רגילה? (עברית)
https://youtu.be/kx3H1jFHncY
קליפ AI של שיר של הביטלס:
https://youtu.be/Z9MZdNrGbM4
כך יוצרים מתמונות בעזרת פרומפט וידאו AI בקלות עם Minimax (עברית):
https://youtu.be/F-gl4E5yo60
קליפ מתמונה:
https://youtu.be/yCczY9PNeao
קדימון AI מדומה לסרט מדע בדיוני שלא קיים. האם בקרוב הסרט?
https://youtu.be/oAIrJP4n5sQ
על סקיצה של ג'ון לנון שהושלמה 40 שנה אחרי מותו עם קליפ משולב דמויות AI:
https://youtu.be/APJAQoSCwuA?long=yes
KREA - מודל ליצירת סרטונים AI:
https://youtu.be/OBewafac0Xs?long=yes
MINIMAX - עוד מודל וידאו מדהים מסין:
https://youtu.be/7JZLLxV1AGc?long=yes
ואוסף חידושי וחדשות AI וידאו מדצמבר 2024:
https://youtu.be/30ZoRlr-TrY?long=yes
כלי יצירת וידאו בעזרת בינה מלאכותית גנרטיבית מתפתחים במהירות אדירה. עד לא מזמן זו הייתה המהפכה הבאה של הבינה המלאכותית, אבל מהירות הפיתוח של הטכנולוגיה הזו, כמו כל תחום הבינה הגנרטיבית, היא בלתי נתפסת ולכן היא כבר כאן ולא עוצרת לרגע.
וכך, נוסקים מה שהיו שנה קודם סרטונים של 4-5 שניות באיכות תמונה בסיסית עד נמוכה והבנה בינונית למדי של הפרומפטים (ההנחיות הטקסטואליות שבהן מתאר המשתמש את התוצאה המבוקשת). בתוך שנה הם הפכו לסרטונים מעולים, באיכות תמונה מעולה, היצמדות להנחיות הפרומפט ומאפשרים לבקש זוויות צילום, סוגי שוטים, סוג או ז'אנר הסרט ועוד.
וגם קהילת הקוד הפתוח (ראו בתגית "קוד פתוח") לא טומנת ידה בצלחת. לעומת מודלים מסחריים סגורים ויקרים למשתמש, המודלים שלהם מאפשרים יצירת סרטונים בארכיטקטורה עם שקיפות וחדשנות וללא עלות, תוך אימוץ של טכנולוגיות AI מהחדשניות ביותר, גם בחינם להורדה והרצה על המחשב המשתמש וגם אונליין, בהגבלות בשל העלות שעולה לשתפן כך.
מדהים לחשוב שמה שבעבר צולם באלפי דולרים מינימום לשניה של סרט, נוצר עכשיו בכמה פקודות מקלדת, שמייצרות סרטונים שווי ערך להפקה מורכבת, יקרה, עתירת מקצוענות וכוח אדם, כשלא פעם ביצועי אפקטים מיוחדים ו-CGI, יקרים ומורכבים לצילום, מוחלפים במחי פקודת מקלדת פשוטה ודמיון מפותח של היוצרים.
היום הבינה המלאכותית יוצרת סרטונים מעולים וברמה מטורפת, אפילו על בסיס של תמונות סטילס (תמונות רגילות), שהועלו אליה ונוספה להם הנחייה שאומרת מה "עושים" האובייקטים שבתמונה כשהם "משתתפים בצילומים".
וזה בדיוק מה שמדאיג היום רבים בתעשיית הקולנוע. קשה להימלט מהמחשבה כמה ואילו מקצועות עומדים להיעלם בקרוב מהעולם, מהמסך, הגדול או הקטן. בצל הקדמה הזו עלולים כמה א.נשים לאבד את פרנסתם. החלפתם הצפויה בבינה מלאכותית תהיה כי היא זולה, יעילה, צייתנית וכזו שאף פעם לא חולה, לא עצובה ולא מאחרת, כי הילד שלה מרגיש לא טוב בבית...
אז לצד זה שהבינה המלאכותית מרגשת, תורמת ליצירתיות וגלומות בה אינספור אפשרויות בלתי נגמרות, היא טומנת בחובה גם איומים וסכנות לאנושות ולנו בני האדם. תעשיית הקולנוע כולה עלולה להיות מוחלפת בהדרגה במיליוני רובוטים שקוראים להם AI ואין להם אפילו גוף לחבוט בו. רק אינטליגנציה מלאכותית, שלא מרחמת ולא חומלת, כי היא עושה רק מה שאומרים לה. במקלדת, כן?
הפתרון, כי חייבים לדבר אופטימית שוטפת, הוא ללמוד את הכלים החדשים הללו. יידע כל מקצוען קולנוע שבמקום להיות מוחלף ב-AI, עדיף לדעת AI ולהשתלב בעולם החדש הזה.
הנה מודל וידאו בינתי ישראלי (עברית):
https://youtu.be/CkpLiPWLcHo
אפשרויות הווידאו AI שהולכות ומתפתחות במהירות:
https://youtu.be/1HVkzZiv82Q
האם מתקרב הסוף של עשיית סרטים רגילה? (עברית)
https://youtu.be/kx3H1jFHncY
קליפ AI של שיר של הביטלס:
https://youtu.be/Z9MZdNrGbM4
כך יוצרים מתמונות בעזרת פרומפט וידאו AI בקלות עם Minimax (עברית):
https://youtu.be/F-gl4E5yo60
קליפ מתמונה:
https://youtu.be/yCczY9PNeao
קדימון AI מדומה לסרט מדע בדיוני שלא קיים. האם בקרוב הסרט?
https://youtu.be/oAIrJP4n5sQ
על סקיצה של ג'ון לנון שהושלמה 40 שנה אחרי מותו עם קליפ משולב דמויות AI:
https://youtu.be/APJAQoSCwuA?long=yes
KREA - מודל ליצירת סרטונים AI:
https://youtu.be/OBewafac0Xs?long=yes
MINIMAX - עוד מודל וידאו מדהים מסין:
https://youtu.be/7JZLLxV1AGc?long=yes
ואוסף חידושי וחדשות AI וידאו מדצמבר 2024:
https://youtu.be/30ZoRlr-TrY?long=yes
איך הפכה שפת התכנות פייתון ללוהטת?
מבין שפות התכנות הרבות נחשבת שפת התכנות פייתון (Python) לאחת משפות הפיתוח הפופולריות ביותר בעולם. זוהי שפה אינטואיטיבית, מובנת ובעלת תחביר קליט ופשוט למדי.
המקור לשם השפה איננו מנחש החנק הענקי, הפיתון. ההשראה היא דווקא סדרת המערכונים הבריטית “מונטי-פייתון”, שהמתכנת ההולנדי שפיתח את שפת התכנות כל כך העריץ.
כשפת תכנות פייתון פופולרית ומועדפת על ידי מתכנתים, מסטארט-אפים וחברות קטנות ועד מי שמפתחים בחברות ענק, כולל גוגל ואינסטגרם.
בשפת פייתון משתמשים כיום מרבית החוקרים והמפתחים בתחומי הבינה המלאכותית, לצד מדעני נתונים ומנתחי מידע, במיוחד עם צמיחת טכנולוגיות כמו למידת מכונה (Machine learning) ולמידה עמוקה (Deep learning) בעשור האחרון.
סוגי פרויקטים שנוטים לפתח בפייתון הם בתחומי תוכנה וקוד מגוונים. ביניהם בולטים יישומי WEB, כלי בינה מלאכותית, פרויקטים של אוטומציה, עיבוד נתונים, מדע נתונים (Data science), אנליזה או ניתוח נתונים (Data analysis), רשתות, אינטרנט, כלים לעיבוד תמונה ועוד.
למעשה, בשנת 2024 פייתון היא כל כך פופולרית, שלראשונה עברה את ג'אווה סקריפט (JavaScript) בתור שפת התכנות הפופולרית ביותר בעולם. בדו"ח שפרסם אתר הקוד העיקרי "גיטהאב" הוא הודיע לראשונה שפייתון עקפה את JavaScript והפכה לשפת התכנות הפופולרית ביותר בעולם.
הסיבה לצמיחה ולשינוי הזה לטובת פייתון היא הזינוק המטורף בשימוש ב-GenAI, בינה יצירתית או גנרטיבית (Generative AI). הפיתוח הגובר של כלי GenAI, על פי גיטהאב, והזינוק בפיתוחים מבוססי דאטה סיינס ודאטה אנליטיקס, הביאו לנסיקה בשימוש בפייתון, הידועה כשפה העיקרית בה משתמשים לפיתוחים אלו.
#יתרונות פייתון
כבר שנים רבות שמהנדסי תוכנה ומתכנתים ותיקים ממליצים על פייתון או ג'אווה סקריפט, בתור שפות התכנות שהכי כדאי להם להתחיל בהן. מי שמשקיעים שעתיים ביום יכולים כבר אחרי 3 חודשים לכתוב תוכנה של ממש.
לאחר מכן כדאי להתמחות באחד התחומים שהיא מאפשרת וטובה בהם, כמו פיתוח יישום ווב (web application), תוכנה רגילה למחשב (Desktop program), למידת מכונה (Machine learning) או בינה מלאכותית (Artificial intelligence).
הנה סקירה קצרה על שפת פייתון (עברית):
https://youtu.be/cKZ0miaDtkw
עוד קצת היכרות עם שפת פייתון (עברית):
https://youtu.be/A7XXmxU3o4o
תמצית בדקה של מה שלומדים בפייתון בשנה:
https://youtu.be/AfR-lJghs4w
היכרות באנגלית:
https://youtu.be/poJfwre2PIs
קורס באורך מלא של תכנות בשפת פייתון:
https://youtu.be/_uQrJ0TkZlc?long=yes
מבין שפות התכנות הרבות נחשבת שפת התכנות פייתון (Python) לאחת משפות הפיתוח הפופולריות ביותר בעולם. זוהי שפה אינטואיטיבית, מובנת ובעלת תחביר קליט ופשוט למדי.
המקור לשם השפה איננו מנחש החנק הענקי, הפיתון. ההשראה היא דווקא סדרת המערכונים הבריטית “מונטי-פייתון”, שהמתכנת ההולנדי שפיתח את שפת התכנות כל כך העריץ.
כשפת תכנות פייתון פופולרית ומועדפת על ידי מתכנתים, מסטארט-אפים וחברות קטנות ועד מי שמפתחים בחברות ענק, כולל גוגל ואינסטגרם.
בשפת פייתון משתמשים כיום מרבית החוקרים והמפתחים בתחומי הבינה המלאכותית, לצד מדעני נתונים ומנתחי מידע, במיוחד עם צמיחת טכנולוגיות כמו למידת מכונה (Machine learning) ולמידה עמוקה (Deep learning) בעשור האחרון.
סוגי פרויקטים שנוטים לפתח בפייתון הם בתחומי תוכנה וקוד מגוונים. ביניהם בולטים יישומי WEB, כלי בינה מלאכותית, פרויקטים של אוטומציה, עיבוד נתונים, מדע נתונים (Data science), אנליזה או ניתוח נתונים (Data analysis), רשתות, אינטרנט, כלים לעיבוד תמונה ועוד.
למעשה, בשנת 2024 פייתון היא כל כך פופולרית, שלראשונה עברה את ג'אווה סקריפט (JavaScript) בתור שפת התכנות הפופולרית ביותר בעולם. בדו"ח שפרסם אתר הקוד העיקרי "גיטהאב" הוא הודיע לראשונה שפייתון עקפה את JavaScript והפכה לשפת התכנות הפופולרית ביותר בעולם.
הסיבה לצמיחה ולשינוי הזה לטובת פייתון היא הזינוק המטורף בשימוש ב-GenAI, בינה יצירתית או גנרטיבית (Generative AI). הפיתוח הגובר של כלי GenAI, על פי גיטהאב, והזינוק בפיתוחים מבוססי דאטה סיינס ודאטה אנליטיקס, הביאו לנסיקה בשימוש בפייתון, הידועה כשפה העיקרית בה משתמשים לפיתוחים אלו.
#יתרונות פייתון
כבר שנים רבות שמהנדסי תוכנה ומתכנתים ותיקים ממליצים על פייתון או ג'אווה סקריפט, בתור שפות התכנות שהכי כדאי להם להתחיל בהן. מי שמשקיעים שעתיים ביום יכולים כבר אחרי 3 חודשים לכתוב תוכנה של ממש.
לאחר מכן כדאי להתמחות באחד התחומים שהיא מאפשרת וטובה בהם, כמו פיתוח יישום ווב (web application), תוכנה רגילה למחשב (Desktop program), למידת מכונה (Machine learning) או בינה מלאכותית (Artificial intelligence).
הנה סקירה קצרה על שפת פייתון (עברית):
https://youtu.be/cKZ0miaDtkw
עוד קצת היכרות עם שפת פייתון (עברית):
https://youtu.be/A7XXmxU3o4o
תמצית בדקה של מה שלומדים בפייתון בשנה:
https://youtu.be/AfR-lJghs4w
היכרות באנגלית:
https://youtu.be/poJfwre2PIs
קורס באורך מלא של תכנות בשפת פייתון:
https://youtu.be/_uQrJ0TkZlc?long=yes
האם בינה גנרטיבית תפגע בנו בעתיד ותיקח לנו את העבודה? ואיך להימנע?
בפשטות כן. אולי לא בכולנו ולא בכל אנשי המקצוע אבל הבינה המלאכותית תוכל לגרום לקשיים עבור רבים - בעבודה ובעולם התעסוקה. באופן מסוים, היא עלולה להביא את העולם אפילו למשבר כלכלי של ממש.
אלא אם... חכו עוד מעט.
בשלהי שנת 2022 כל העולם דיבר לפתע על הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer.
מודל השפה שעליו התבססו המפתחים בחברת Open AI נקרא GPT-3, אבל גרסה 4 ואלו שאחריה לא יאחרו והמירוץ לפתח אותו ומודלים רבים אחרים יימשך. כי במקביל לעבודה המדהימה שעושים מפתחי Open AI פותחו די מהר כלים מתחרים.
ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.
אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך בעיניים עצומות על הידע והמידע שהם מציעים לנו, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות.
#אז הלך עלינו?
הבינה המלאכותית שמפגינים ChatGPT ושאר כלי ה-GPT יכולה לעשות בהצטיינות עבודות של איסוף ומיון של מידע או ידע (שני דברים שונים) ואחרי זה גם כתיבה ויצירה.
כי ה-AI ברמה הגבוהה הזו יודעת לחקות אמנות, לצייר, לתקן תמונות, למצוא תשובות לשאלות, להכין שיעורי בית, להמציא מתכונים, לכתוב עבודה לבית הספר, לחבר מוסיקה, לערוך וידאו, לכתוב קוד ולתכנת, לחבר טקסטים, לנסח מכתבים ומאמרים ועוד.
אבל היא יודעת בעיקר ליצור דברים דומים למה שכבר נעשה. אמנם ברמה גבוהה, אפילו מאוד, אבל על סמך חשיבה מקצועית וסטנדרטית של אנשי מקצוע בתחומים השונים.
#מה היא לא?
בתחום היצירה הבינה המלאכותית לא תשתווה לאנשים יצירתיים, מקוריים, שיסטו ממה שכולם יודעים לעשות ויחוללו את הפלאים שלהם. היא תדע לעשות טוב יותר ומהר יותר את מה שאנשי מקצוע טובים עושים, אבל היא תתקשה לצאת מהטוב אל המצוין, הגאוני, המבריק.
לכן היא לא תפגע באנשי מקצוע מעולים ומקוריים, בבני אדם יצירתיים, עם חשיבה מיוחדת ולא שבלונית, עם יכולת המצאה.
#אז מה ההזדמנות?
וזו רבותי ההזדמנות שלכם. משתלם היום לפתח את היצירתיות והחשיבה המקורית, ללכת על להיות קצת יותר אמן ממידען, להיות מעט פחות מהנדס "רגיל" ויותר ממציא ומי שמוצא פתרונות, כולל באינטרנט אבל לא רק - כי פתרונות לתחום אחד כבר מיושמים לא פעם בתחום אחר.
נמשיך? - להיות יותר סופר מאשר עיתונאי, יותר מלחין מאשר רק נגן ויותר מעצב מאשר גרפיקאי ביצועיסט.
#יכולות?
לשם כך דרושות יכולות מגוונות שמערכת החינוך והעולם המקצועי לא מפתחים יותר מדי. יצירתיות, ידע כללי, סקרנות וחוצפה הם חלק מהיכולות הללו.
יצירתיות - הציצו אצלנו בתגית "יצירתיות" והבינו את הצד הזה ואיך לפתח אותו. התחלה מעולה לרכישת ידע כללי תהיה באאוריקה, בהאזנה לפודקסטים, צפייה בסרטי דוקו וסרטונים של ידע ביוטיוב ועיון בבלוגים של ידע, באזור המסקרן והלא משעמם של האינטרנט ובתנאי שהוא מתויג ולא חד-ממדי.
סקרנות - גם היא תכונה שנולדתם איתה וכדאי לשמר, במיוחד כשמסביבכם יעשה כמעט כל גוף חינוכי ניסיון להשבית אותה, לטובת חיפוש תשובות סטנדרטיות ושתהיו ותנהגו "כמו כולם". כל דבר שתלמדו לבד ותחקרו אין ספק שתזכרו טוב יותר ויום אחד עשוי לשרת אתכם, לעומת שיעורי בית שכמעט אף פעם לא.
היזהרו מתופעה שבעולם החינוך מוכרת כ"Yessing". חיפוש חשובות שהמורה יאהב, תשובות לשאלות שניתן למצוא בקלות ואפילו בלי חשיבה. אז מה הטעם בהן? לא עדיף שישאלו אותנו בבית הספר מעט פחות שאלות, אבל כאלה שיעודדו אותנו להשתמש בשתי האונות או בכל אזורי המוח? חקרו כאן את תגית "סקרנות".
חוצפה - על זה לא צריך להרחיב אבל נדגיש שמדובר בחוצפה מקצועית ולא התנהגותית. להעז. לא לומר לעצמכם שאינכם יודעים מספיק כדי לפתח או להמציא, לחבר או לצייר. פשוט ללכת על זה, לחקור איך, לאסוף דרכים, לחפש שיטות וטכניקות לאמנות וליצירה ביד.
נסו להמציא שיטות חדשות לעשות דברים וחקרו אותן, לנסות לעבוד איתן. חפשו ידע ושאלו באינטרנט עד שתקבלו תשובות. כתבו דברים כי לא פעם רק כשכותבים מבינים. זה בסדר לגנוב ולהעתיק ואז לפרק, ללמוד, להרכיב מחדש, לעבד ולהבין כיצד לשלוט במיומנויות הכרחיות. אם אין זמן אז קומו שעתיים קודם או לכו לישון מאוחר, גם אם תהיו קצת עייפים בבית ספר. גם ככה, אתם יודעים...
כישלונות - עוד דבר שיעזור ויהיה הכרחי הוא היכולת שלא להיבהל מכשלון ואפילו ללמוד לחבק אותו. חינכו אותנו שההצלחה היא המטרה, בעוד שמה שמתקשר אצל רובנו עם כישלון הוא כמעט תמיד אכזבה ופנים נפולות. אז כדאי שתדעו שכישלונות הם חלק בלתי נפרד מההצלחה.
היכולת שלא להרפות וליפול ברוח מהכשלון היא שמבדילה בין בני אדם. היא שמביאה נשים ואנשים בסופו של דבר להצלחה. אדיסון, מגדולי הממציאים, אמר על זה פעם שההמצאות הגדולות שלו היו כולן כשהוא לא הצליח להיכשל...
כדאי להאמין לו. אמר את זה אדם שחתום על מאות פטנטים והמצאות ששינו את העולם. בשום מקום לא נכתב כמה פעמים הוא נכשל בכל תהליך, עד שהוא הצליח בו. תמיד מספרים רק על ההצלחות אז אנחנו לא יודעים על הקשיים והנפילות, על התסכול וההפסדים.
אבל עכשיו אתם יודעים. לכן אם אומרים לך שזה גרוע? -המשיכי. צעקו לך בוז? - המשך. כמעט כל מצליחן ופורץ דרך שמע את זה בהתחלה. על בוב דילן אמרו שיש לו קול של צפרדע, המטוסים של האחים רייט צללו בזה אחר זה, הבכורה של האופרה הכי פופולרית בהיסטוריה "כרמן" הסתיימה בקריאות בוז וירקות שהושלכו על הבמה. את הסרט "בלייד ראנר" קטלו כשהוא עלה לאקרנים ואת סוקרטס הוציאו להורג על השחתת הנוער...
אז אמרו... מה הם יודעים? מי מהמבקרים והפוסלים את היזמת שאת הצליח לפני זה?
לא להרפות! אין הבטחות, אבל עקביות חשובה לא פחות מחשיבה, יצירתיות, סקרנות ומקוריות. בלעדיה כמעט ואין סיכוי להגיע למימוש כי לא מגיעים בכלל.
#אתם הורים?
אם אתם מגדלים היום את ילדיכם יש לכם אחריות ואפשרויות. תנו להם כלים, יכולות, הרימו ותפתחו את הכשרונות המלבלבים שלהם. אל תכבו אותם עם הרגיל ועם מה שאתם למדתם או רציתם להיות. בעולם שלהם אתם תהיו מבוגרים מדי או, וסליחה שאנחנו מזכירים, אולי כבר לא תהיו.
תנו להם לחקור מה ירצו לעשות. חישפו אותם לתחומים, לעולמות ולתופעות. תנו להם דוגמה אישית, קראו ספרים, אל תעשנו, אל תהיו בטטות - צאו לעשות ספורט ואם כבר אז גם אכלו נכון. צאו איתם לטבע, לטיול או הליכה, הביטו יחד בפרחים, נסו לזהות אותם ולחקור עליהם.
קראו ספר בעצמכם והביאו את הספריה של הבית לסלון, אל מול עיניהם. כבו מדי פעם את הטלוויזיה ונהלו שיחות ביניכם אל מול עיניהם ואיתם. שתפו אותם, שאלו על מה מעניין אותם ומה ירצו להיות, מה החלומות שלהם, איפה הם רואים את עצמם בגיל 25.
התעניינו בהם באמת. מה מסקרן אותם. מה מרגש ומלהיב בשבילם. התעניינו איזה חוג הכי מעניין אותם ואם אין מספיק כסף בקשו בשקט הנחה כדי שלא לבייש אותם.
נסו להשיג להם דברים שיאפשרו להם לפתח את תחומי העניין, לקנות יד שנייה, לחנך אותם שחדש זה ממש סתם ואם ראו משהו זרוק שלא יתביישו לקחת, לפרק ולהרכיב ממנו חללית. צפו איתם בתכניות מדע או בסרטי דוקו, הראו להם סרטים קלאסיים, למדו אותם ששחור לבן הוא לא פחות צבעוני ושמינימליזם הוא לא פעם הכי עשיר שיש (Less is more).
אה, ובגיל צעיר ספרו להם סיפור לפני השינה. זה כל כך חשוב שאתם לא מעלים על הדעת. הרבה יותר מ-GPT, מציור בינתי וממדעי המחשב באוניברסיטה. היו הורים, לא רק אנשי קריירה.
הנה ChatGPT ולמה בחינוך מודאגים ממנו:
https://youtu.be/Fn8jDanbf0c
בעלי מקצוע מפחדים על העבודה שלהם (עברית):
https://youtu.be/0AGYOv0sGHg
תראו למשל איך הוא מייצר קליפים (עברית):
https://youtu.be/8CmXtj5gW2I
במבט לעתיד, השינוי שה-AI ייצר הוא אדיר ותלוי גם בנו (מתורגם):
https://youtu.be/RzkD_rTEBYs
איך הצ'אט GPT בניתוח קוד? (עברית)
https://youtu.be/Z46pqHFuKHs
בחיוך - מה הכלי היחידי שיש לנו כבני אדם כדי לזהות אם הכותב או הדובר הוא בוט כמו ChatGPT? (עברית)
https://youtu.be/nes_xZjZweY
מה קורה כששואלים את הבינה של גוגל על זה (עברית):
https://youtu.be/oh4Bq8ifgK4?long=yes
וזה יקרה בשלבים ולא מיד:
https://youtu.be/iNKFOCki42I?long=yes
בפשטות כן. אולי לא בכולנו ולא בכל אנשי המקצוע אבל הבינה המלאכותית תוכל לגרום לקשיים עבור רבים - בעבודה ובעולם התעסוקה. באופן מסוים, היא עלולה להביא את העולם אפילו למשבר כלכלי של ממש.
אלא אם... חכו עוד מעט.
בשלהי שנת 2022 כל העולם דיבר לפתע על הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer.
מודל השפה שעליו התבססו המפתחים בחברת Open AI נקרא GPT-3, אבל גרסה 4 ואלו שאחריה לא יאחרו והמירוץ לפתח אותו ומודלים רבים אחרים יימשך. כי במקביל לעבודה המדהימה שעושים מפתחי Open AI פותחו די מהר כלים מתחרים.
ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.
אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך בעיניים עצומות על הידע והמידע שהם מציעים לנו, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות.
#אז הלך עלינו?
הבינה המלאכותית שמפגינים ChatGPT ושאר כלי ה-GPT יכולה לעשות בהצטיינות עבודות של איסוף ומיון של מידע או ידע (שני דברים שונים) ואחרי זה גם כתיבה ויצירה.
כי ה-AI ברמה הגבוהה הזו יודעת לחקות אמנות, לצייר, לתקן תמונות, למצוא תשובות לשאלות, להכין שיעורי בית, להמציא מתכונים, לכתוב עבודה לבית הספר, לחבר מוסיקה, לערוך וידאו, לכתוב קוד ולתכנת, לחבר טקסטים, לנסח מכתבים ומאמרים ועוד.
אבל היא יודעת בעיקר ליצור דברים דומים למה שכבר נעשה. אמנם ברמה גבוהה, אפילו מאוד, אבל על סמך חשיבה מקצועית וסטנדרטית של אנשי מקצוע בתחומים השונים.
#מה היא לא?
בתחום היצירה הבינה המלאכותית לא תשתווה לאנשים יצירתיים, מקוריים, שיסטו ממה שכולם יודעים לעשות ויחוללו את הפלאים שלהם. היא תדע לעשות טוב יותר ומהר יותר את מה שאנשי מקצוע טובים עושים, אבל היא תתקשה לצאת מהטוב אל המצוין, הגאוני, המבריק.
לכן היא לא תפגע באנשי מקצוע מעולים ומקוריים, בבני אדם יצירתיים, עם חשיבה מיוחדת ולא שבלונית, עם יכולת המצאה.
#אז מה ההזדמנות?
וזו רבותי ההזדמנות שלכם. משתלם היום לפתח את היצירתיות והחשיבה המקורית, ללכת על להיות קצת יותר אמן ממידען, להיות מעט פחות מהנדס "רגיל" ויותר ממציא ומי שמוצא פתרונות, כולל באינטרנט אבל לא רק - כי פתרונות לתחום אחד כבר מיושמים לא פעם בתחום אחר.
נמשיך? - להיות יותר סופר מאשר עיתונאי, יותר מלחין מאשר רק נגן ויותר מעצב מאשר גרפיקאי ביצועיסט.
#יכולות?
לשם כך דרושות יכולות מגוונות שמערכת החינוך והעולם המקצועי לא מפתחים יותר מדי. יצירתיות, ידע כללי, סקרנות וחוצפה הם חלק מהיכולות הללו.
יצירתיות - הציצו אצלנו בתגית "יצירתיות" והבינו את הצד הזה ואיך לפתח אותו. התחלה מעולה לרכישת ידע כללי תהיה באאוריקה, בהאזנה לפודקסטים, צפייה בסרטי דוקו וסרטונים של ידע ביוטיוב ועיון בבלוגים של ידע, באזור המסקרן והלא משעמם של האינטרנט ובתנאי שהוא מתויג ולא חד-ממדי.
סקרנות - גם היא תכונה שנולדתם איתה וכדאי לשמר, במיוחד כשמסביבכם יעשה כמעט כל גוף חינוכי ניסיון להשבית אותה, לטובת חיפוש תשובות סטנדרטיות ושתהיו ותנהגו "כמו כולם". כל דבר שתלמדו לבד ותחקרו אין ספק שתזכרו טוב יותר ויום אחד עשוי לשרת אתכם, לעומת שיעורי בית שכמעט אף פעם לא.
היזהרו מתופעה שבעולם החינוך מוכרת כ"Yessing". חיפוש חשובות שהמורה יאהב, תשובות לשאלות שניתן למצוא בקלות ואפילו בלי חשיבה. אז מה הטעם בהן? לא עדיף שישאלו אותנו בבית הספר מעט פחות שאלות, אבל כאלה שיעודדו אותנו להשתמש בשתי האונות או בכל אזורי המוח? חקרו כאן את תגית "סקרנות".
חוצפה - על זה לא צריך להרחיב אבל נדגיש שמדובר בחוצפה מקצועית ולא התנהגותית. להעז. לא לומר לעצמכם שאינכם יודעים מספיק כדי לפתח או להמציא, לחבר או לצייר. פשוט ללכת על זה, לחקור איך, לאסוף דרכים, לחפש שיטות וטכניקות לאמנות וליצירה ביד.
נסו להמציא שיטות חדשות לעשות דברים וחקרו אותן, לנסות לעבוד איתן. חפשו ידע ושאלו באינטרנט עד שתקבלו תשובות. כתבו דברים כי לא פעם רק כשכותבים מבינים. זה בסדר לגנוב ולהעתיק ואז לפרק, ללמוד, להרכיב מחדש, לעבד ולהבין כיצד לשלוט במיומנויות הכרחיות. אם אין זמן אז קומו שעתיים קודם או לכו לישון מאוחר, גם אם תהיו קצת עייפים בבית ספר. גם ככה, אתם יודעים...
כישלונות - עוד דבר שיעזור ויהיה הכרחי הוא היכולת שלא להיבהל מכשלון ואפילו ללמוד לחבק אותו. חינכו אותנו שההצלחה היא המטרה, בעוד שמה שמתקשר אצל רובנו עם כישלון הוא כמעט תמיד אכזבה ופנים נפולות. אז כדאי שתדעו שכישלונות הם חלק בלתי נפרד מההצלחה.
היכולת שלא להרפות וליפול ברוח מהכשלון היא שמבדילה בין בני אדם. היא שמביאה נשים ואנשים בסופו של דבר להצלחה. אדיסון, מגדולי הממציאים, אמר על זה פעם שההמצאות הגדולות שלו היו כולן כשהוא לא הצליח להיכשל...
כדאי להאמין לו. אמר את זה אדם שחתום על מאות פטנטים והמצאות ששינו את העולם. בשום מקום לא נכתב כמה פעמים הוא נכשל בכל תהליך, עד שהוא הצליח בו. תמיד מספרים רק על ההצלחות אז אנחנו לא יודעים על הקשיים והנפילות, על התסכול וההפסדים.
אבל עכשיו אתם יודעים. לכן אם אומרים לך שזה גרוע? -המשיכי. צעקו לך בוז? - המשך. כמעט כל מצליחן ופורץ דרך שמע את זה בהתחלה. על בוב דילן אמרו שיש לו קול של צפרדע, המטוסים של האחים רייט צללו בזה אחר זה, הבכורה של האופרה הכי פופולרית בהיסטוריה "כרמן" הסתיימה בקריאות בוז וירקות שהושלכו על הבמה. את הסרט "בלייד ראנר" קטלו כשהוא עלה לאקרנים ואת סוקרטס הוציאו להורג על השחתת הנוער...
אז אמרו... מה הם יודעים? מי מהמבקרים והפוסלים את היזמת שאת הצליח לפני זה?
לא להרפות! אין הבטחות, אבל עקביות חשובה לא פחות מחשיבה, יצירתיות, סקרנות ומקוריות. בלעדיה כמעט ואין סיכוי להגיע למימוש כי לא מגיעים בכלל.
#אתם הורים?
אם אתם מגדלים היום את ילדיכם יש לכם אחריות ואפשרויות. תנו להם כלים, יכולות, הרימו ותפתחו את הכשרונות המלבלבים שלהם. אל תכבו אותם עם הרגיל ועם מה שאתם למדתם או רציתם להיות. בעולם שלהם אתם תהיו מבוגרים מדי או, וסליחה שאנחנו מזכירים, אולי כבר לא תהיו.
תנו להם לחקור מה ירצו לעשות. חישפו אותם לתחומים, לעולמות ולתופעות. תנו להם דוגמה אישית, קראו ספרים, אל תעשנו, אל תהיו בטטות - צאו לעשות ספורט ואם כבר אז גם אכלו נכון. צאו איתם לטבע, לטיול או הליכה, הביטו יחד בפרחים, נסו לזהות אותם ולחקור עליהם.
קראו ספר בעצמכם והביאו את הספריה של הבית לסלון, אל מול עיניהם. כבו מדי פעם את הטלוויזיה ונהלו שיחות ביניכם אל מול עיניהם ואיתם. שתפו אותם, שאלו על מה מעניין אותם ומה ירצו להיות, מה החלומות שלהם, איפה הם רואים את עצמם בגיל 25.
התעניינו בהם באמת. מה מסקרן אותם. מה מרגש ומלהיב בשבילם. התעניינו איזה חוג הכי מעניין אותם ואם אין מספיק כסף בקשו בשקט הנחה כדי שלא לבייש אותם.
נסו להשיג להם דברים שיאפשרו להם לפתח את תחומי העניין, לקנות יד שנייה, לחנך אותם שחדש זה ממש סתם ואם ראו משהו זרוק שלא יתביישו לקחת, לפרק ולהרכיב ממנו חללית. צפו איתם בתכניות מדע או בסרטי דוקו, הראו להם סרטים קלאסיים, למדו אותם ששחור לבן הוא לא פחות צבעוני ושמינימליזם הוא לא פעם הכי עשיר שיש (Less is more).
אה, ובגיל צעיר ספרו להם סיפור לפני השינה. זה כל כך חשוב שאתם לא מעלים על הדעת. הרבה יותר מ-GPT, מציור בינתי וממדעי המחשב באוניברסיטה. היו הורים, לא רק אנשי קריירה.
הנה ChatGPT ולמה בחינוך מודאגים ממנו:
https://youtu.be/Fn8jDanbf0c
בעלי מקצוע מפחדים על העבודה שלהם (עברית):
https://youtu.be/0AGYOv0sGHg
תראו למשל איך הוא מייצר קליפים (עברית):
https://youtu.be/8CmXtj5gW2I
במבט לעתיד, השינוי שה-AI ייצר הוא אדיר ותלוי גם בנו (מתורגם):
https://youtu.be/RzkD_rTEBYs
איך הצ'אט GPT בניתוח קוד? (עברית)
https://youtu.be/Z46pqHFuKHs
בחיוך - מה הכלי היחידי שיש לנו כבני אדם כדי לזהות אם הכותב או הדובר הוא בוט כמו ChatGPT? (עברית)
https://youtu.be/nes_xZjZweY
מה קורה כששואלים את הבינה של גוגל על זה (עברית):
https://youtu.be/oh4Bq8ifgK4?long=yes
וזה יקרה בשלבים ולא מיד:
https://youtu.be/iNKFOCki42I?long=yes
מהם סוכני AI ומה הם עושים?
במשפט אחד נאמר שסוכן AI ממיר את הידע של כיצד לעשות דברים ליכולות לעשות אותם ולעשייה ממוקדת וספציפית בפועל.
בשנת 2024 התחילה תעשיית ה-AI במרוץ לפיתוח "סוכנים חכמים" (AI agents) או "סוכני AI" בשמם הפופולרי (LLM Agents). מובילי הטכנולוגיה חוזים שהאייג'נטים הללו יהיו התוכנות החדשות ושהעולם יהיה מלא בהם.
סוכן ה-AI הוא המשך של הצ'טבוטים הוותיקים והעוזרים החכמים שעזרו לנו בעשור השני של המאה ה-21. הוא הופך את האינטליגנציה של הבינה המלאכותית לפעולה וליכולות ביצוע. הוא מבין את ההוראות שלך, מעבד את המידע הזה ומספקים את מה שביקשת - תשובה, פתרון, הסבר או עזרה בהשלמת משימה.
ברגע שהוא מוגדר היטב ומצויד בכלי ה-AI המתאימים, הסוכן החכם מטפל במשימות באופן מושכל ומדויק ומשחרר את המשתמשים להתמקד בענייניהם.
המשימה תבוצע, בהתחייבות של AI. זו מהפכה שעומדת להיות מהפכה מטורפת. אבל מיהם אותם סוכנים ומה בדיוק הם מאומנים ויכולים לעשות בשבילנו?
#מה זה סוכן AI?
אם AI באנגלית הוא ראשי התיבות של בינה מלאכותית, צריך להבין שבינה מלאכותית לכשעצמה היא מוח גולמי עם ים של פוטנציאל. אבל עד שלא נשאל אותה, עד שלא נבקש ממנה לעשות משהו ספציפי, ניתן לה תפקיד או משימה, היא לא תהיה ממש שימושית.
וזו בדיוק המשמעות של סוכן חכם, או סוכן AI. אם בינה מלאכותית היא גאון עם המון יכולת, אך כזה שהוא "ראש קטן", סוכן AI הוא ביצועיסט, סוג של בינה מעשית שבאמת נותנת עבודה, אבל יש לה יכולות מסוימות ורק אותן.
במילים פשוטות, האייג'נט עם ה-AI הוא עוזר וירטואלי חכם שמסוגל לבצע בעצמו משימות ספציפיות, תוך שימוש יעיל ביכולות הבינה המלאכותית. כמו ששעון מעורר יכול להעיר אותנו בבוקר, סוכן AI יכול לבדוק את המיילים שלנו, לתכנן לנו טיול בחו"ל, למצוא לנו בדיחות או אפילו לנגן לנו מוסיקה לפי מצב הרוח שלנו.
כלומר, בזמן שבינה מלאכותית עניינה להיות חכמה נורא ולדעת הכל, הסוכן החכם עם ה-AI הוא הגרסה המעשית. הוא זה שמבצע משימות מוגדרות ומבצע היטב. אפשר לדמות אותו למישהו מוכשר שמתגייס לצבא ואחרי שאומן לביצוע משימות מסוימות, הוא ממתין לפקודות. רק כשהוא מקבל פקודה או משימה, הוא "עושה את מה שצריך" ומבצע וממלא את ההוראות.
#איך הם עושים זאת?
התשובה הכי קצרה היא: באמצעות ביצוע של משימות בצורה חכמה, עצמאית ויעילה.
סוכני AI מאומנים ומצוידים, כך שהם יידעו כיצד להגיב הכי טוב לדרישות, למצבים ולצרכים שונים. הם מבצעים את המבוקש מהם, לאחר שקיבלו הוראות מפורטות וגם נתונים שהם צריכים לקבל או לאתר.
סוכנים מצוידי AI נבנו כך שיהיו מסוגלים להבין דרישות, לחוש את המשתמש, לפרש נתונים, להבין את הסביבה, לקבל החלטות מושכלות ולבצע פעולות מורכבות יחסית - עד שיצליחו להשיג את המטרות שהוגדרו מראש.
כך מצליחים סוכני בינה מלאכותית כאלו להגביר את היעילות שלהם עבורנו, בני האדם. הם עושים זאת למשל, על ידי אוטומציה של משימות שגרתיות שמוטלות עלינו, מה שנקרא לא פעם "עבודה שחורה".
בכך מאפשרים הסוכנים הבינתיים הללו לעובדים האנושיים שאנחנו, להתרכז באסטרטגיה ויצירתיות.
מודלי השפה הרחבים (LLMs) שבהם הם מצוידים מאפשרים לאייג'נטים הללו לבצע משימות בצורה עצמאית ויעילה. עוד משולבים בהם מודלים מתקדמים לעיבוד שפה טבעית, מה שמאפשר להם להבין פרומפטים, הוראות, הנחיות וטקסטים בכתיבה טבעית. תוך יישום של טכניקות ניתוח מתקדמות כמו "העץ המחשבה" או "שרשרת המחשבה" וביחד עם טכניקות ויכולות של למידת מכונה, הם יכולים להציע ביצועים מדהימים.
הסוכנים הללו משפרים את הפרודוקטיביות, מפחיתים טעויות ומאפשרים שיתוף. חלקם ממלאים משימות מוגדרות מראש, אחרים עונים על שאלות, יש היכולים לתקשר בקול אנושי ולנהל שיחה רגילה. לעתים הם מתוכנתים לנהוג ולחשוב כאילו הם פקיד, מזכירה, מנהל חשבונות, מדענית, סוכן נסיעות או תחקירן - רבים מהם ספציפיים וממלאים משימה אחת היטב ואחרים ממלאים מגוון של משימות ואפילו בו-זמנית.
ההבנה היא שבאמצעות יכולת ניתוח של נתונים מורכבים ויכולת למידה מתמשכת הסוכנים החכמים הללו ימשיכו לפעול ולצבור ניסיון, תוך שהם הופכים ומתחדדים, לכלים נבונים ובעלי ביצועים טובים יותר ויותר.
#איך עובדים איתם?
אתם נכנסים לסוכן אינטליגנטי שאתם יודעים שמבצע משימה מסוימת ונותנים לו הוראות. מצידו, תהליך העבודה מתחיל בקבלת המטרה המוגדרת שנתתם לו. הוא מפתח במהירות הבזק תוכנית פעולה, בוחר את הכלים המתאימים לביצוע של המשימה שלא פעם הוא יפרק למשימות משנה וכאן מגיע ביצוע המשימות בפועל והערכה של התוצאות.
הכל מתבצע בצורה אוטונומית, מבלי להיעזר בכם. בדרך כלל הסוכן מסתמך על נתונים והקשרים שנאספו במהלך ה"שיחות" הקודמות שלכם ו"לומד אתכם" ומה הציפיות שלכם ממנו.
כי אחת התכונות החשובות של סוכני AI נעוצה ביכולת שלהם ללמוד ולהשתפר לאורך זמן. הם מנתחים כל הזמן את תגובותיכם והפעולות שלכם, לומדים מהמשוב שקיבלו מכם ומבצעים התאמות שישפרו את הביצועים שלהם. כך יכולים סוכני AI להתפתח ולהתאים את עצמם לצרכים המשתנים שלכם ולהגיב טוב ומדויק יותר למגוון רחב של צרכים וסיטואציות.
הסוכן AI מגיש לכם את התוצאות ואתם מוזמנים להמשיך ולנהל איתו דיאלוג. אפשר לבקש ממנו הרחבות ושיפורים. תוכלו גם להכניס שינויים בבקשה המקורית או עדכונים, להטיל עליו לבצע פעולות שישפרו את הדיוק למה שיתאים לצרכים שלכם וכך הלאה.
#דוגמאות?
האפשרויות כמעט אינסופיות. כבר היום יש סוכנים חכמים רבים. יש מהם שיכולים לבצע חישובים, לחפש באינטרנט, להבין תמונות, לנתח מסמכים מורכבים, לגשת למאגרי מידע ולהפעיל המון כלים נוספים.
יש סוכנים שנותנים תשובות על שאלות בתחומים שונים כמו משפטים או מיסים, אחרים בונים תכנית טיול שמותאמת לבקשותינו ולכלל המשתנים, יש שמזמינים כרטיסים להופעות או מקומות במסעדות, אחרים מנסחים טקסטים וכדומה.
יש מהם שמבצעים אוטומציות שעושות בשבילך את העבודה, ממיינות את המיילים או מטפלות ב-To do list, כלומר ניהול המשימות האישי ועוד.
סוכני AI ייעודיים אחרים מפיקים טקסטים מותאמים אישית, למטרות כמו אימיילים, דו"חות, קורות חיים וחומרי שיווק. יכולותיהם מתגלות במיטבן כשהם מצליחים להתאים את רמת האוטונומיה שלהם, בהתאם לצרכים של המשתמשים ומטרותיהם.
הנה הסבר על סוכני AI:
https://youtu.be/wazHMMaiDEA
הבשלת היכולות של סוכנים חכמים מצוידי AI היא תוצאה של שנות התפתחות רבות:
https://youtu.be/WftLJZw6Cf8
צריך לתת סיכוי לסוכני AI חכמים (מתורגם):
https://youtu.be/xq8Ws1jyBX4
סוכן AI לפיתוח כלי תוכנה ואפליקציות רשת:
https://youtu.be/Wvyc2E6OHm8
הצ'טבוט המתקדם של Open AI שמשמש מתורגמן:
https://youtu.be/c2DFg53Zhvw
הכירו את ה-Projects של קלוד לבניית ושימוש בסוכני AI (עברית):
https://youtu.be/8mWR1r28ia4
הנה הסבר מקיף של סוכני ה-AI החדשים:
https://youtu.be/S9dc0y_Zesc?long=yes
והדגמת GPT 4o שהופך לסוכן AI ומסוגל לעשות פעולות שונות בשירותך:
https://youtu.be/DrKkKLEditU?long=yes
במשפט אחד נאמר שסוכן AI ממיר את הידע של כיצד לעשות דברים ליכולות לעשות אותם ולעשייה ממוקדת וספציפית בפועל.
בשנת 2024 התחילה תעשיית ה-AI במרוץ לפיתוח "סוכנים חכמים" (AI agents) או "סוכני AI" בשמם הפופולרי (LLM Agents). מובילי הטכנולוגיה חוזים שהאייג'נטים הללו יהיו התוכנות החדשות ושהעולם יהיה מלא בהם.
סוכן ה-AI הוא המשך של הצ'טבוטים הוותיקים והעוזרים החכמים שעזרו לנו בעשור השני של המאה ה-21. הוא הופך את האינטליגנציה של הבינה המלאכותית לפעולה וליכולות ביצוע. הוא מבין את ההוראות שלך, מעבד את המידע הזה ומספקים את מה שביקשת - תשובה, פתרון, הסבר או עזרה בהשלמת משימה.
ברגע שהוא מוגדר היטב ומצויד בכלי ה-AI המתאימים, הסוכן החכם מטפל במשימות באופן מושכל ומדויק ומשחרר את המשתמשים להתמקד בענייניהם.
המשימה תבוצע, בהתחייבות של AI. זו מהפכה שעומדת להיות מהפכה מטורפת. אבל מיהם אותם סוכנים ומה בדיוק הם מאומנים ויכולים לעשות בשבילנו?
#מה זה סוכן AI?
אם AI באנגלית הוא ראשי התיבות של בינה מלאכותית, צריך להבין שבינה מלאכותית לכשעצמה היא מוח גולמי עם ים של פוטנציאל. אבל עד שלא נשאל אותה, עד שלא נבקש ממנה לעשות משהו ספציפי, ניתן לה תפקיד או משימה, היא לא תהיה ממש שימושית.
וזו בדיוק המשמעות של סוכן חכם, או סוכן AI. אם בינה מלאכותית היא גאון עם המון יכולת, אך כזה שהוא "ראש קטן", סוכן AI הוא ביצועיסט, סוג של בינה מעשית שבאמת נותנת עבודה, אבל יש לה יכולות מסוימות ורק אותן.
במילים פשוטות, האייג'נט עם ה-AI הוא עוזר וירטואלי חכם שמסוגל לבצע בעצמו משימות ספציפיות, תוך שימוש יעיל ביכולות הבינה המלאכותית. כמו ששעון מעורר יכול להעיר אותנו בבוקר, סוכן AI יכול לבדוק את המיילים שלנו, לתכנן לנו טיול בחו"ל, למצוא לנו בדיחות או אפילו לנגן לנו מוסיקה לפי מצב הרוח שלנו.
כלומר, בזמן שבינה מלאכותית עניינה להיות חכמה נורא ולדעת הכל, הסוכן החכם עם ה-AI הוא הגרסה המעשית. הוא זה שמבצע משימות מוגדרות ומבצע היטב. אפשר לדמות אותו למישהו מוכשר שמתגייס לצבא ואחרי שאומן לביצוע משימות מסוימות, הוא ממתין לפקודות. רק כשהוא מקבל פקודה או משימה, הוא "עושה את מה שצריך" ומבצע וממלא את ההוראות.
#איך הם עושים זאת?
התשובה הכי קצרה היא: באמצעות ביצוע של משימות בצורה חכמה, עצמאית ויעילה.
סוכני AI מאומנים ומצוידים, כך שהם יידעו כיצד להגיב הכי טוב לדרישות, למצבים ולצרכים שונים. הם מבצעים את המבוקש מהם, לאחר שקיבלו הוראות מפורטות וגם נתונים שהם צריכים לקבל או לאתר.
סוכנים מצוידי AI נבנו כך שיהיו מסוגלים להבין דרישות, לחוש את המשתמש, לפרש נתונים, להבין את הסביבה, לקבל החלטות מושכלות ולבצע פעולות מורכבות יחסית - עד שיצליחו להשיג את המטרות שהוגדרו מראש.
כך מצליחים סוכני בינה מלאכותית כאלו להגביר את היעילות שלהם עבורנו, בני האדם. הם עושים זאת למשל, על ידי אוטומציה של משימות שגרתיות שמוטלות עלינו, מה שנקרא לא פעם "עבודה שחורה".
בכך מאפשרים הסוכנים הבינתיים הללו לעובדים האנושיים שאנחנו, להתרכז באסטרטגיה ויצירתיות.
מודלי השפה הרחבים (LLMs) שבהם הם מצוידים מאפשרים לאייג'נטים הללו לבצע משימות בצורה עצמאית ויעילה. עוד משולבים בהם מודלים מתקדמים לעיבוד שפה טבעית, מה שמאפשר להם להבין פרומפטים, הוראות, הנחיות וטקסטים בכתיבה טבעית. תוך יישום של טכניקות ניתוח מתקדמות כמו "העץ המחשבה" או "שרשרת המחשבה" וביחד עם טכניקות ויכולות של למידת מכונה, הם יכולים להציע ביצועים מדהימים.
הסוכנים הללו משפרים את הפרודוקטיביות, מפחיתים טעויות ומאפשרים שיתוף. חלקם ממלאים משימות מוגדרות מראש, אחרים עונים על שאלות, יש היכולים לתקשר בקול אנושי ולנהל שיחה רגילה. לעתים הם מתוכנתים לנהוג ולחשוב כאילו הם פקיד, מזכירה, מנהל חשבונות, מדענית, סוכן נסיעות או תחקירן - רבים מהם ספציפיים וממלאים משימה אחת היטב ואחרים ממלאים מגוון של משימות ואפילו בו-זמנית.
ההבנה היא שבאמצעות יכולת ניתוח של נתונים מורכבים ויכולת למידה מתמשכת הסוכנים החכמים הללו ימשיכו לפעול ולצבור ניסיון, תוך שהם הופכים ומתחדדים, לכלים נבונים ובעלי ביצועים טובים יותר ויותר.
#איך עובדים איתם?
אתם נכנסים לסוכן אינטליגנטי שאתם יודעים שמבצע משימה מסוימת ונותנים לו הוראות. מצידו, תהליך העבודה מתחיל בקבלת המטרה המוגדרת שנתתם לו. הוא מפתח במהירות הבזק תוכנית פעולה, בוחר את הכלים המתאימים לביצוע של המשימה שלא פעם הוא יפרק למשימות משנה וכאן מגיע ביצוע המשימות בפועל והערכה של התוצאות.
הכל מתבצע בצורה אוטונומית, מבלי להיעזר בכם. בדרך כלל הסוכן מסתמך על נתונים והקשרים שנאספו במהלך ה"שיחות" הקודמות שלכם ו"לומד אתכם" ומה הציפיות שלכם ממנו.
כי אחת התכונות החשובות של סוכני AI נעוצה ביכולת שלהם ללמוד ולהשתפר לאורך זמן. הם מנתחים כל הזמן את תגובותיכם והפעולות שלכם, לומדים מהמשוב שקיבלו מכם ומבצעים התאמות שישפרו את הביצועים שלהם. כך יכולים סוכני AI להתפתח ולהתאים את עצמם לצרכים המשתנים שלכם ולהגיב טוב ומדויק יותר למגוון רחב של צרכים וסיטואציות.
הסוכן AI מגיש לכם את התוצאות ואתם מוזמנים להמשיך ולנהל איתו דיאלוג. אפשר לבקש ממנו הרחבות ושיפורים. תוכלו גם להכניס שינויים בבקשה המקורית או עדכונים, להטיל עליו לבצע פעולות שישפרו את הדיוק למה שיתאים לצרכים שלכם וכך הלאה.
#דוגמאות?
האפשרויות כמעט אינסופיות. כבר היום יש סוכנים חכמים רבים. יש מהם שיכולים לבצע חישובים, לחפש באינטרנט, להבין תמונות, לנתח מסמכים מורכבים, לגשת למאגרי מידע ולהפעיל המון כלים נוספים.
יש סוכנים שנותנים תשובות על שאלות בתחומים שונים כמו משפטים או מיסים, אחרים בונים תכנית טיול שמותאמת לבקשותינו ולכלל המשתנים, יש שמזמינים כרטיסים להופעות או מקומות במסעדות, אחרים מנסחים טקסטים וכדומה.
יש מהם שמבצעים אוטומציות שעושות בשבילך את העבודה, ממיינות את המיילים או מטפלות ב-To do list, כלומר ניהול המשימות האישי ועוד.
סוכני AI ייעודיים אחרים מפיקים טקסטים מותאמים אישית, למטרות כמו אימיילים, דו"חות, קורות חיים וחומרי שיווק. יכולותיהם מתגלות במיטבן כשהם מצליחים להתאים את רמת האוטונומיה שלהם, בהתאם לצרכים של המשתמשים ומטרותיהם.
הנה הסבר על סוכני AI:
https://youtu.be/wazHMMaiDEA
הבשלת היכולות של סוכנים חכמים מצוידי AI היא תוצאה של שנות התפתחות רבות:
https://youtu.be/WftLJZw6Cf8
צריך לתת סיכוי לסוכני AI חכמים (מתורגם):
https://youtu.be/xq8Ws1jyBX4
סוכן AI לפיתוח כלי תוכנה ואפליקציות רשת:
https://youtu.be/Wvyc2E6OHm8
הצ'טבוט המתקדם של Open AI שמשמש מתורגמן:
https://youtu.be/c2DFg53Zhvw
הכירו את ה-Projects של קלוד לבניית ושימוש בסוכני AI (עברית):
https://youtu.be/8mWR1r28ia4
הנה הסבר מקיף של סוכני ה-AI החדשים:
https://youtu.be/S9dc0y_Zesc?long=yes
והדגמת GPT 4o שהופך לסוכן AI ומסוגל לעשות פעולות שונות בשירותך:
https://youtu.be/DrKkKLEditU?long=yes
מהו המחשב המלחין?
המחשב IAMUS הוא מחשב שמלחין מוסיקה. IAMUS שהתוכנה שבו יוצרת מנגינות, הרמוניה ומרקמים מוסיקליים נעימים לאוזן, נבנה בידי מדענים באוניברסיטה של מאלגה בספרד.
אם היה מבחן טיורינג ליצירתיות, מעניין אם המוסיקה של המחשב יאמוס הייתה מסוגלת להטעות אנשים מיומנים לחשוב שהיא נכתבה בידי בני אדם. כלומר, האם מלחין וירטואלי היה מצליח להתחזות למלחין בן אנוש..
כמובן שיאמוס המחשב אינו יצירתי כמו בן-אנוש. בשלב הזה הוא בעיקר יודע לבצע את פעולת ההלחנה, על פי הכללים ה"נכונים" שאותם יודע כל מלחין מיומן שלמד וקיבל השכלה מוסיקלית. לגבי היופי והמקוריות של המוסיקה שיוצר המחשב הזה, יש מחלוקת רבה עד כמה הוא "יצירתי".
הכירו את מבחן לאבלייס שבוחן אם מכונה אכן ממציאה רעיונות מוסיקליים בעצמה (מתורגם):
https://youtu.be/Rh9vBczqMk0
למידת מכונה שמסייעת ליוצרים לחבר מקצבים ומהלכים בהיפ הופ:
https://youtu.be/mOjWyRqiDds
הבה נחקור את תוכנת IAMUS של המלחין הממוחשב:
https://youtu.be/KhiupLtyibs
הנה יצירה של יאמוס לקלרינט סולו:
https://youtu.be/FCsbEY9pxTU
להרכב קאמרי:
https://youtu.be/Uq3iKbCNDCM
קטעים מהתקליטור הראשון של יאמוס עם מוסיקה שלו:
https://youtu.be/cv4y_BRJokM
ומדריך מגניב להלחנה בעזרת קבצי MIDI שיוצר ChatGPT:
https://youtu.be/tV82Wy-tXRE?long=yes
המחשב IAMUS הוא מחשב שמלחין מוסיקה. IAMUS שהתוכנה שבו יוצרת מנגינות, הרמוניה ומרקמים מוסיקליים נעימים לאוזן, נבנה בידי מדענים באוניברסיטה של מאלגה בספרד.
אם היה מבחן טיורינג ליצירתיות, מעניין אם המוסיקה של המחשב יאמוס הייתה מסוגלת להטעות אנשים מיומנים לחשוב שהיא נכתבה בידי בני אדם. כלומר, האם מלחין וירטואלי היה מצליח להתחזות למלחין בן אנוש..
כמובן שיאמוס המחשב אינו יצירתי כמו בן-אנוש. בשלב הזה הוא בעיקר יודע לבצע את פעולת ההלחנה, על פי הכללים ה"נכונים" שאותם יודע כל מלחין מיומן שלמד וקיבל השכלה מוסיקלית. לגבי היופי והמקוריות של המוסיקה שיוצר המחשב הזה, יש מחלוקת רבה עד כמה הוא "יצירתי".
הכירו את מבחן לאבלייס שבוחן אם מכונה אכן ממציאה רעיונות מוסיקליים בעצמה (מתורגם):
https://youtu.be/Rh9vBczqMk0
למידת מכונה שמסייעת ליוצרים לחבר מקצבים ומהלכים בהיפ הופ:
https://youtu.be/mOjWyRqiDds
הבה נחקור את תוכנת IAMUS של המלחין הממוחשב:
https://youtu.be/KhiupLtyibs
הנה יצירה של יאמוס לקלרינט סולו:
https://youtu.be/FCsbEY9pxTU
להרכב קאמרי:
https://youtu.be/Uq3iKbCNDCM
קטעים מהתקליטור הראשון של יאמוס עם מוסיקה שלו:
https://youtu.be/cv4y_BRJokM
ומדריך מגניב להלחנה בעזרת קבצי MIDI שיוצר ChatGPT:
https://youtu.be/tV82Wy-tXRE?long=yes
מהם טוקנים ב-AI ולמידת מכונה?
מאסימוני הטלפונים ועד עולם אבטחת מערכות מחשוב, טוקן (Token), בעברית “אסימון”, הוא מושג המשתנה בהתאם להקשר שבו הוא מוזכר. אפילו בתוך עולם המחשבים יש למושג טוקן כמה שימושים.
בלמידת מכונה, אחת הזירות המרתקות של העידן המודרני והתחום בו פועלים המודלים הפופולריים של ימינו, כמו Claude או ChatGPT, לטוקנים יש משמעות אדירה.
אותם מודלים גדולים, LLMים, הם מודלים מתמטיים. כדי לבצע את המשימות שאנו מבקשים מהם, תוך כדי תקשורת איתם בשפה טבעית, כמו אנגלית, עברית וכדומה, הם משתמשים בתהליך שנקרא "טוקניזציה".
במרכז הטוקניזציה נעשה פילוח של הטקסטים שהמודלים הללו מקבלים כנתונים, כדאטה, ליחידות קטנות יותר, תרגום של חלקי המידע הקטנים למספרים, כשאת יחידות המידע הללו, שהומרו למספרים, הם ינתחו בהמשך.
כך, אחרי שמסתיימת הטוקניזציה, הם מייצרים מהמידע טוקנים, מספרים שכל אחד מהם מייצג פריט מידע קטן. ה"טוקן" משמש בהם בתפקיד "אסימון למידת המכונה", שמתאר באופן מתמטי את יחידות הטקסט הקטנות. אלה מעין יחידות מידה שהמודלים המוכרים יוצרים מהקונטקסט.
לאחר שסיימו להפוך את המידע לטוקנים, מרבית המודלים שאנו מכירים הטוקנים משמשים לייצוג של הטקסט, ביחידות קטנות שהמודל מעבד בצורה מתמטית.
כשאנו משתמשים בטוקנים, זה כדי לסייע למודל להבין את המבנה של הטקסט, כך שיוכל לבצע על פיו את החישובים שלו. טוקן אחד יכול להיות כל חלק ממילה בשפה הרגילה שלנו, או אפילו תו אחד.
כדי להבין ולהגיב לקלט, המודל משתמש בכמות מסוימת של טוקנים. וטוקן יכול להיות כל פיסת מידע, מתו בודד ועד מילה שלמה ולעתים גם יותר. יש שיטות שונות של טוקניזציה והבחירה ביניהן היא בהתאם לאלגוריתם בו משתמשים. יש שהאסימון הוא לפי תווים (Character tokenization), אסימון לפי מילים, לפי משפט, ביטויים, טוקניזציה לפי מילת משנה ולפי מספר.
בשיחה על מודל AI (ה-LLM, כמו ChatGPT או Claude) משמש הטוקן לציון גודל השיחה על המודל והיקף המידע שיכול להיות בה. לכל מודל יש מגבלה של זיכרון התוכן שהוא יכול לעבד בשיחה אחת ולהתבסס עליו בתשובות שלו ובמהלך השיחה.
כל הטקסט שהמודל מכיל ובא מהקלט שמזרים לו המשתמש, כולל השאלות והתשובות וכל מידע נוסף, כל אלו מכונים "קונטקסט" (Context), כלומר "ההקשר".
חלון ההקשר (context window), או "חלון הקונטקסט", מייצג את כמות התוכן שהמודל יכול לעבד בשיחה עם משתמש. הכמות הזו נספרת בטוקנים. אם קלוד, למשל, תומך ב-200 אלף טוקנים, זה אומר שהשיחה יכולה לכלול כ-40 אלף מילים. אם לג'מיני של גוגל יש מיליון טוקנים, זה אומר פי 5 יותר מילים וגודל חלון הקונטקסט שלה, כלומר השיחות עם ג'מיני הוא של כ-2 ספרים ממוצעים.
טוקניזציה כפי שהיא נעשית בידי מדעני נתונים:
https://youtu.be/fNxaJsNG3-s
פרמטרים וטוקנים הם לא הכל במודלים:
https://youtu.be/a1nqXQMOCks
הסבר של Machine Learning Token באנגלית:
https://youtu.be/mnqXgojQCJI
וטוקניזציה באתרי אינטרנט שיכולה לשמש בהקשר אחר כאמצעי אבטחה:
https://youtu.be/Y7I4IDojhJk
מאסימוני הטלפונים ועד עולם אבטחת מערכות מחשוב, טוקן (Token), בעברית “אסימון”, הוא מושג המשתנה בהתאם להקשר שבו הוא מוזכר. אפילו בתוך עולם המחשבים יש למושג טוקן כמה שימושים.
בלמידת מכונה, אחת הזירות המרתקות של העידן המודרני והתחום בו פועלים המודלים הפופולריים של ימינו, כמו Claude או ChatGPT, לטוקנים יש משמעות אדירה.
אותם מודלים גדולים, LLMים, הם מודלים מתמטיים. כדי לבצע את המשימות שאנו מבקשים מהם, תוך כדי תקשורת איתם בשפה טבעית, כמו אנגלית, עברית וכדומה, הם משתמשים בתהליך שנקרא "טוקניזציה".
במרכז הטוקניזציה נעשה פילוח של הטקסטים שהמודלים הללו מקבלים כנתונים, כדאטה, ליחידות קטנות יותר, תרגום של חלקי המידע הקטנים למספרים, כשאת יחידות המידע הללו, שהומרו למספרים, הם ינתחו בהמשך.
כך, אחרי שמסתיימת הטוקניזציה, הם מייצרים מהמידע טוקנים, מספרים שכל אחד מהם מייצג פריט מידע קטן. ה"טוקן" משמש בהם בתפקיד "אסימון למידת המכונה", שמתאר באופן מתמטי את יחידות הטקסט הקטנות. אלה מעין יחידות מידה שהמודלים המוכרים יוצרים מהקונטקסט.
לאחר שסיימו להפוך את המידע לטוקנים, מרבית המודלים שאנו מכירים הטוקנים משמשים לייצוג של הטקסט, ביחידות קטנות שהמודל מעבד בצורה מתמטית.
כשאנו משתמשים בטוקנים, זה כדי לסייע למודל להבין את המבנה של הטקסט, כך שיוכל לבצע על פיו את החישובים שלו. טוקן אחד יכול להיות כל חלק ממילה בשפה הרגילה שלנו, או אפילו תו אחד.
כדי להבין ולהגיב לקלט, המודל משתמש בכמות מסוימת של טוקנים. וטוקן יכול להיות כל פיסת מידע, מתו בודד ועד מילה שלמה ולעתים גם יותר. יש שיטות שונות של טוקניזציה והבחירה ביניהן היא בהתאם לאלגוריתם בו משתמשים. יש שהאסימון הוא לפי תווים (Character tokenization), אסימון לפי מילים, לפי משפט, ביטויים, טוקניזציה לפי מילת משנה ולפי מספר.
בשיחה על מודל AI (ה-LLM, כמו ChatGPT או Claude) משמש הטוקן לציון גודל השיחה על המודל והיקף המידע שיכול להיות בה. לכל מודל יש מגבלה של זיכרון התוכן שהוא יכול לעבד בשיחה אחת ולהתבסס עליו בתשובות שלו ובמהלך השיחה.
כל הטקסט שהמודל מכיל ובא מהקלט שמזרים לו המשתמש, כולל השאלות והתשובות וכל מידע נוסף, כל אלו מכונים "קונטקסט" (Context), כלומר "ההקשר".
חלון ההקשר (context window), או "חלון הקונטקסט", מייצג את כמות התוכן שהמודל יכול לעבד בשיחה עם משתמש. הכמות הזו נספרת בטוקנים. אם קלוד, למשל, תומך ב-200 אלף טוקנים, זה אומר שהשיחה יכולה לכלול כ-40 אלף מילים. אם לג'מיני של גוגל יש מיליון טוקנים, זה אומר פי 5 יותר מילים וגודל חלון הקונטקסט שלה, כלומר השיחות עם ג'מיני הוא של כ-2 ספרים ממוצעים.
טוקניזציה כפי שהיא נעשית בידי מדעני נתונים:
https://youtu.be/fNxaJsNG3-s
פרמטרים וטוקנים הם לא הכל במודלים:
https://youtu.be/a1nqXQMOCks
הסבר של Machine Learning Token באנגלית:
https://youtu.be/mnqXgojQCJI
וטוקניזציה באתרי אינטרנט שיכולה לשמש בהקשר אחר כאמצעי אבטחה:
https://youtu.be/Y7I4IDojhJk
מה זה UBI שישמור בעתיד על מובטלי ה-AI?
מדובר ברעיון מסעיר ויצירתי. הוא נקרא "הכנסה בסיסית אוניברסלית" (Universal Basic Income בקיצור UBI) ובעזרתו יש מי שמנסים לקדם את פני הרעה של הקדמה הבינתית, המאיימת על כל עולם התעסוקה של העתיד.
כוונתו להעמיד לרשות כל אדם הכנסה בסיסית, שמטרתה לסייע בהפחתת ההשפעות של הטכנולוגיה על העובדים. הכנסה בסיסית כזו תחושב על ידי "חישוב בסיסי אוניברסלי" ודי אחיד.
הרעיון הוא להציע הכנסה בסיסית אוניברסלית, מעין תשלום מזומן, ללא תנאים, שיינתן לכל מבוגרי האוכלוסייה, ללא קשר לעושרם ולמצבם התעסוקתי. המטרה היא לספק רשת ביטחון לאנשים שהמשרות והתעסוקה שלהם מאוימות על ידי חידושי הטכנולוגיה, כולל ובמיוחד הרובוטיקה והבינה המלאכותית.
הכוונה היא לאפשר להם לחפש עבודה בתחומים שמדברים אליהם ומעניינים אותם, בדברים שיסייעו להם לממש את עצמם והם יכולים להצליח בהם, לבלוט ולנצנץ - אולי אפילו ליזום עסק משלהם וליצור לעצמם בסיס כלכלי מבלי להיות שכירים, באיום מתמיד של אבטלה...
גם אם שמרנים רבים נוטים לדחות את מה שהם תופסים כרווחה שתקטין את המוטיבציה של אנשים לחפש עבודה ולעבוד, ניסיונות לחלק UBI לתושבי ערים ומדינות בארצות הברית הראו תוצאות חיוביות בדרך כלל. חלק מהתוכניות הללו, אגב, העניקו את התשלומים באופן סלקטיבי לאנשים, על סמך הצורך המוכח או המעמד החברתי שלהם ולא לכל האוכלוסייה כולה.
בין התומכים ביוזמה הזו ניתן למצוא גם רבים מראשי ומצליחני ההייטק, כולל מי שמובילים את התפוצצות ה-AI הנוכחית, ביניהם מנכ"ל חברת OpenAI והאדם הכי חזק בעולם הבינה המלאכותית כרגע, סם אלטמן.
לשיטתו, דווקא בשל החשש שהבינה המלאכותית תלך ותחליף אינספור עובדים אנושיים, כולל אנשים שלמדו מקצועות ורכשו תארים ומומחיות ויהפכו למובטלים, אולי אפילו מובטלים כרוניים, דווקא בצל החשש הזה כדאי לתת את ההכנסה הבסיסית המדוברת.
לשיטתו של אלטמן, כל אזרח יקבל, אולי במקום כסף, חלק ממחשב סופר-מתקדם, שהוא מכנה לצורך העניין GPT-7. כל מקבל כזה, אלטמן גורס, יכול יהיה לעשות כרצונו בחלק שקיבל. יהיו מי שישתמשו בו ויקימו מיזם, למשל טכנולוגי, או יהיו שותפים במיזם כזה, אחרים ירצו אולי למכור את החלק שלהם לאחרים, יהיו שיעדיפו לתרום אותו לטובת מחקר בפתרון בעיות עולמיות, כמו משבר האקלים או חקר הסרטן.
ההנחה של מנכ"ל OpenAI היא שעם הטמעתה של הבינה המלאכותית המתקדמת ביותר ויותר היבטים של חיינו, הבעלות על יחידה של מודל שפה גדול, כזה שהוא מכנה GPT7, עשויה להיות בעלת ערך גדול יותר מאשר כסף. אלטמן רואה עולם בו כל אדם בחברה העתידית יחזיק למעשה חלק מהקידמה והיצרנות העתידית ויוכלו להבטיח לעצמם ולמשפחתם פרנסה בעתיד.
הנה רעיון ההכנסה הבסיסית אוניברסלית (עברית):
https://youtu.be/8rM_-49DPe4
בטלנות? רוגע כלכלי? - על ניסוי ראשון איך זה ישפיע על בני אדם? (עברית)
https://youtu.be/u_-N_AWQQiI
בעלי מקצוע מפחדים על העבודה שלהם (עברית):
https://youtu.be/0AGYOv0sGHg
וסרטון מקיף על ה-UBI ומשמעויותיו (מתורגם):
https://youtu.be/kl39KHS07Xc?long=yes
מדובר ברעיון מסעיר ויצירתי. הוא נקרא "הכנסה בסיסית אוניברסלית" (Universal Basic Income בקיצור UBI) ובעזרתו יש מי שמנסים לקדם את פני הרעה של הקדמה הבינתית, המאיימת על כל עולם התעסוקה של העתיד.
כוונתו להעמיד לרשות כל אדם הכנסה בסיסית, שמטרתה לסייע בהפחתת ההשפעות של הטכנולוגיה על העובדים. הכנסה בסיסית כזו תחושב על ידי "חישוב בסיסי אוניברסלי" ודי אחיד.
הרעיון הוא להציע הכנסה בסיסית אוניברסלית, מעין תשלום מזומן, ללא תנאים, שיינתן לכל מבוגרי האוכלוסייה, ללא קשר לעושרם ולמצבם התעסוקתי. המטרה היא לספק רשת ביטחון לאנשים שהמשרות והתעסוקה שלהם מאוימות על ידי חידושי הטכנולוגיה, כולל ובמיוחד הרובוטיקה והבינה המלאכותית.
הכוונה היא לאפשר להם לחפש עבודה בתחומים שמדברים אליהם ומעניינים אותם, בדברים שיסייעו להם לממש את עצמם והם יכולים להצליח בהם, לבלוט ולנצנץ - אולי אפילו ליזום עסק משלהם וליצור לעצמם בסיס כלכלי מבלי להיות שכירים, באיום מתמיד של אבטלה...
גם אם שמרנים רבים נוטים לדחות את מה שהם תופסים כרווחה שתקטין את המוטיבציה של אנשים לחפש עבודה ולעבוד, ניסיונות לחלק UBI לתושבי ערים ומדינות בארצות הברית הראו תוצאות חיוביות בדרך כלל. חלק מהתוכניות הללו, אגב, העניקו את התשלומים באופן סלקטיבי לאנשים, על סמך הצורך המוכח או המעמד החברתי שלהם ולא לכל האוכלוסייה כולה.
בין התומכים ביוזמה הזו ניתן למצוא גם רבים מראשי ומצליחני ההייטק, כולל מי שמובילים את התפוצצות ה-AI הנוכחית, ביניהם מנכ"ל חברת OpenAI והאדם הכי חזק בעולם הבינה המלאכותית כרגע, סם אלטמן.
לשיטתו, דווקא בשל החשש שהבינה המלאכותית תלך ותחליף אינספור עובדים אנושיים, כולל אנשים שלמדו מקצועות ורכשו תארים ומומחיות ויהפכו למובטלים, אולי אפילו מובטלים כרוניים, דווקא בצל החשש הזה כדאי לתת את ההכנסה הבסיסית המדוברת.
לשיטתו של אלטמן, כל אזרח יקבל, אולי במקום כסף, חלק ממחשב סופר-מתקדם, שהוא מכנה לצורך העניין GPT-7. כל מקבל כזה, אלטמן גורס, יכול יהיה לעשות כרצונו בחלק שקיבל. יהיו מי שישתמשו בו ויקימו מיזם, למשל טכנולוגי, או יהיו שותפים במיזם כזה, אחרים ירצו אולי למכור את החלק שלהם לאחרים, יהיו שיעדיפו לתרום אותו לטובת מחקר בפתרון בעיות עולמיות, כמו משבר האקלים או חקר הסרטן.
ההנחה של מנכ"ל OpenAI היא שעם הטמעתה של הבינה המלאכותית המתקדמת ביותר ויותר היבטים של חיינו, הבעלות על יחידה של מודל שפה גדול, כזה שהוא מכנה GPT7, עשויה להיות בעלת ערך גדול יותר מאשר כסף. אלטמן רואה עולם בו כל אדם בחברה העתידית יחזיק למעשה חלק מהקידמה והיצרנות העתידית ויוכלו להבטיח לעצמם ולמשפחתם פרנסה בעתיד.
הנה רעיון ההכנסה הבסיסית אוניברסלית (עברית):
https://youtu.be/8rM_-49DPe4
בטלנות? רוגע כלכלי? - על ניסוי ראשון איך זה ישפיע על בני אדם? (עברית)
https://youtu.be/u_-N_AWQQiI
בעלי מקצוע מפחדים על העבודה שלהם (עברית):
https://youtu.be/0AGYOv0sGHg
וסרטון מקיף על ה-UBI ומשמעויותיו (מתורגם):
https://youtu.be/kl39KHS07Xc?long=yes
מהי טפשת ה-AI שתפגע באיכות התוכן והקוד?
אחת התופעות שמתחילות להתגלות בשנים האחרונות, מאז הפריצה של הבינה המלאכותית הגנרטיבית, היא של טפשת שגורמת הבינה הגנרטיבית למידע ולתוכן באינטרנט.
ברור שהשימוש הכל כך קל ב-Generative AI מקל על המשתמשים, אבל ידוע לכל שיש לבדוק את המידע שהיא יוצרת לפני שמחזירים אותו לציבור כמידע שיצרו בני אדם. מסתבר שרבים לא מבינים את החולשות והפגמים שעדיין מלאים בהם מודלי השפה, אותם מודלים גדולים (LLMs) שעושים היום את הידע. אם אלה תכנים שהתקבלו מקלוד או ChatGPT, רכיבי AI שנועדו לייצר קוד בתכנות, וידאו או תמונות גנרטיביות שיוצרים מנועים שונים ועוד.
התופעה הזו כבר פוגעת באיכות המידע באינטרנט, לפי בדיקות אובייקטיביות שעורכים באופן תקופתי לאיכות הרשת. מסתבר שלא זו בלבד שבני אדם מסתמכים על מידע שחלקו לא מדויק בלשון המעטה, אלא שהקרולרים עצמם, אותן תוכנות שאוספות את המידע מהרשת לצורך אימון, הזנת ועדכון מודלי השפה הגדולים - מסתבר שהם עצמם מסתמכים על המידע הגרוע הזה. ובדיוק כך, הוא חוזר למודל השפה ונכנס לתוכן שמקוטלג לטוקנים (Tokens) ובחזרה לדאטה שעליו הם מסתמכים. התוצאה היא שיותר ויותר מידע לא בדוק ולא אחראי, שהגיע מלכתחילה לרשת ממודלי שפה לא בשלים מספיק, חוזר ומפרה את המודלים הבוגרים, שאמורים לקבל מידע אנושי ואיכותי ולא תמיד יודעים לאתר את השגיאות שבו.
גם בעולם העסקים והארגונים יש כבר החמרה. הירידה באיכות התוכן שבאינטרנט נובעת מהשימוש הגובר והולך בחומר בינוני, שהגיע מהבינה המלאכותית הגנרטיבית, אך לא בוגרת, של הדור הראשון. כבר עם ההשקה של ChatGPT ב-2022, גילו מנהלים את הצ'טבוט שמאפשר להם ליצור חומרים באמצעות בינה מלאכותית יוצרת (generative AI) וחיפשו דרכים להשתמש בהם, במקום בעבודה של עובדים או חברות מיקור החוץ שבהם השתמשו בעבר. מעט מאותם מאמצים התגלו כיעילים ומרביתם נשארו בפוטנציאל יותר מאשר החליפו עובדים.
אך בתחום התכנות זה כן קרה. מסתבר שמודלים כמו CoPilot, Claude ואחרים מייצרים קוד במהירות ומחליפים את הג'וניורים, המתכנתים הצעירים בתעשייה. לפי סקרים שמתפרסמים בעולם נראה שקצב האימוץ של המנועים הללו הוא גבוה, במיוחד ביחס לזמן הקצר שבו הם פועלים. אלא שבסוף 2024 מתחיל להסתבר שכ-40% מהמתכנתים בעולם משתמשים בכלים כאלה ומשגרים קוד שלפחות בחלקו הוא פחות מוצלח. קוד זה חוזר ו"נלמד" על ידי המודלים ומוריד את איכות התכנות שלהם באופן מתמשך, שעלול אף להחמיר.
אחת התופעות שמתחילות להתגלות בשנים האחרונות, מאז הפריצה של הבינה המלאכותית הגנרטיבית, היא של טפשת שגורמת הבינה הגנרטיבית למידע ולתוכן באינטרנט.
ברור שהשימוש הכל כך קל ב-Generative AI מקל על המשתמשים, אבל ידוע לכל שיש לבדוק את המידע שהיא יוצרת לפני שמחזירים אותו לציבור כמידע שיצרו בני אדם. מסתבר שרבים לא מבינים את החולשות והפגמים שעדיין מלאים בהם מודלי השפה, אותם מודלים גדולים (LLMs) שעושים היום את הידע. אם אלה תכנים שהתקבלו מקלוד או ChatGPT, רכיבי AI שנועדו לייצר קוד בתכנות, וידאו או תמונות גנרטיביות שיוצרים מנועים שונים ועוד.
התופעה הזו כבר פוגעת באיכות המידע באינטרנט, לפי בדיקות אובייקטיביות שעורכים באופן תקופתי לאיכות הרשת. מסתבר שלא זו בלבד שבני אדם מסתמכים על מידע שחלקו לא מדויק בלשון המעטה, אלא שהקרולרים עצמם, אותן תוכנות שאוספות את המידע מהרשת לצורך אימון, הזנת ועדכון מודלי השפה הגדולים - מסתבר שהם עצמם מסתמכים על המידע הגרוע הזה. ובדיוק כך, הוא חוזר למודל השפה ונכנס לתוכן שמקוטלג לטוקנים (Tokens) ובחזרה לדאטה שעליו הם מסתמכים. התוצאה היא שיותר ויותר מידע לא בדוק ולא אחראי, שהגיע מלכתחילה לרשת ממודלי שפה לא בשלים מספיק, חוזר ומפרה את המודלים הבוגרים, שאמורים לקבל מידע אנושי ואיכותי ולא תמיד יודעים לאתר את השגיאות שבו.
גם בעולם העסקים והארגונים יש כבר החמרה. הירידה באיכות התוכן שבאינטרנט נובעת מהשימוש הגובר והולך בחומר בינוני, שהגיע מהבינה המלאכותית הגנרטיבית, אך לא בוגרת, של הדור הראשון. כבר עם ההשקה של ChatGPT ב-2022, גילו מנהלים את הצ'טבוט שמאפשר להם ליצור חומרים באמצעות בינה מלאכותית יוצרת (generative AI) וחיפשו דרכים להשתמש בהם, במקום בעבודה של עובדים או חברות מיקור החוץ שבהם השתמשו בעבר. מעט מאותם מאמצים התגלו כיעילים ומרביתם נשארו בפוטנציאל יותר מאשר החליפו עובדים.
אך בתחום התכנות זה כן קרה. מסתבר שמודלים כמו CoPilot, Claude ואחרים מייצרים קוד במהירות ומחליפים את הג'וניורים, המתכנתים הצעירים בתעשייה. לפי סקרים שמתפרסמים בעולם נראה שקצב האימוץ של המנועים הללו הוא גבוה, במיוחד ביחס לזמן הקצר שבו הם פועלים. אלא שבסוף 2024 מתחיל להסתבר שכ-40% מהמתכנתים בעולם משתמשים בכלים כאלה ומשגרים קוד שלפחות בחלקו הוא פחות מוצלח. קוד זה חוזר ו"נלמד" על ידי המודלים ומוריד את איכות התכנות שלהם באופן מתמשך, שעלול אף להחמיר.
אילו מקצועות ייפגעו מהבינה המלאכותית הגנרטיבית?
אנו בעידן הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer. הצ'ט בוט הזה מוביל שורה של פיתוחים דומים ולמעשה הוליד, כמעט יש מאין, עולם חדש של טכנולוגיות. יצירתיות, חדשניות ומדהימות.
העניין הזה כבר הוליד פועל חדש בעברית, כשהמערכות הללו מתחילות לג'נרט (מלשון generate), כלומר לייצר תוכן באופן אוטומטי על ידי מחשבים ומודלי שפה תבוניים, דוגמת ChatGPT, Claude, Gemini ודומיהם.
מודלי השפה הללו מתקדמים במהירות והמירוץ לפתחם ימשיך. במקביל לעבודה המדהימה שעושים המפתחים של O.AI יוצאים כל הזמן כלים מתחרים, כולל של ענקיות כמו גוגל, פייסבוק ואמזון, העובדות על מוצרים דומים.
ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.
אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך עליו ועל הידע והמידע שהיא מציע לנו בכל התחומים, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות. בעניינים אחרים המרוץ לבשלות ככל הנראה ימשיך והם יגיעו די מהר...
קשה אולי להאמין שהמקצועות שאנו מכירים ייעלמו לגמרי. וגם אלו שאכן ייעלמו - זה לא יקרה מיד, אבל זה תהליך שיימשך, תהליך בו מקצועות עבודה יהפכו יותר ויותר למקצועות של פיקוח על הבינה המלאכותית שעושה אותה.
כשהאדם מפקח על עבודת המכונה, הוא יצטרך להיות בתחום כדי להיכנס לפעולה כשהמכונה נתקלת בבעיה שהיא לא יודעת לפתור, לא מתפקדת, מתקלקלת וכדומה.
אז אילו סוגי מקצועות ייפגעו מהבינה? - ההערכה היא שבעיקר מדובר בעבודות הקשורות בשפה. כל מי שמשתמשים בעבודה שלהם בשפה, באופן ישיר ומשמעותי ולא הכרח ביכולות אחרות, פיזיות, ליטרלי שריריות, יכולים לשער שהבינה המלאכותית תוכל לבצע במעלה ההתפתחות שלה את מלאכתם.
עיתונאים, מידענים, תחקירנים, אנשי שיווק, פרסום ויוצרי תוכן, מתכנתים ואפילו מוסיקאים - אצל כולם השפה היא כלי מרכזי בו הם עושים שימוש בליבת שיטת העבודה. אז זה לא שלא יהיו עיתונאי-על, או מוסיקאים אנושיים - הם פשוט יהיו מעטים ומעולים. השאר ימצאו את עצמם מוקפים באנשים שאינם אנשי מקצוע, אך למדו לנצל כלי AI ולייצר תוצרים שייתחרו בשלהם.
גם אנשי מדיה צריכים לדעת שהמקצועות שלהם יעברו שינויים משמעותיים ולמעשה כבר עוברים. עורכי סרטים, צלמים, יוצרי סרטים, מקליטים, עובדי אולפנים, טכנאי סאונד, עורכי אפקטים ומעצבים גרפיים - המקצועות הללו כבר עוברים שינויים וכדאי שיתעדכנו בהם היטב כי כך יוכלו להשתנות עם התחום ולהתבגר לחידושי ה-AI שייכנסו אליו, למצוינות והובלה בו.
הנה השפעת הבינה המלאכותית על העולם האנושי שלנו (מתורגם):
https://youtu.be/RzkD_rTEBYs
יחליף את המורים? - למה בחינוך מודאגים ממודל השפה החדש?
https://youtu.be/Fn8jDanbf0c
האם הג'י פי טי יחליף למשל את הסופרים ויכתוב ספרים, כמו שהוא מייצר היום ספרי ילדים (עברית):
https://youtu.be/sDjFRAP0Szg
ומה הוא עושה לתלמידים והמורים (עברית):
https://youtu.be/vmmUiyeGNB8?long=yes
אנו בעידן הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer. הצ'ט בוט הזה מוביל שורה של פיתוחים דומים ולמעשה הוליד, כמעט יש מאין, עולם חדש של טכנולוגיות. יצירתיות, חדשניות ומדהימות.
העניין הזה כבר הוליד פועל חדש בעברית, כשהמערכות הללו מתחילות לג'נרט (מלשון generate), כלומר לייצר תוכן באופן אוטומטי על ידי מחשבים ומודלי שפה תבוניים, דוגמת ChatGPT, Claude, Gemini ודומיהם.
מודלי השפה הללו מתקדמים במהירות והמירוץ לפתחם ימשיך. במקביל לעבודה המדהימה שעושים המפתחים של O.AI יוצאים כל הזמן כלים מתחרים, כולל של ענקיות כמו גוגל, פייסבוק ואמזון, העובדות על מוצרים דומים.
ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.
אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך עליו ועל הידע והמידע שהיא מציע לנו בכל התחומים, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות. בעניינים אחרים המרוץ לבשלות ככל הנראה ימשיך והם יגיעו די מהר...
קשה אולי להאמין שהמקצועות שאנו מכירים ייעלמו לגמרי. וגם אלו שאכן ייעלמו - זה לא יקרה מיד, אבל זה תהליך שיימשך, תהליך בו מקצועות עבודה יהפכו יותר ויותר למקצועות של פיקוח על הבינה המלאכותית שעושה אותה.
כשהאדם מפקח על עבודת המכונה, הוא יצטרך להיות בתחום כדי להיכנס לפעולה כשהמכונה נתקלת בבעיה שהיא לא יודעת לפתור, לא מתפקדת, מתקלקלת וכדומה.
אז אילו סוגי מקצועות ייפגעו מהבינה? - ההערכה היא שבעיקר מדובר בעבודות הקשורות בשפה. כל מי שמשתמשים בעבודה שלהם בשפה, באופן ישיר ומשמעותי ולא הכרח ביכולות אחרות, פיזיות, ליטרלי שריריות, יכולים לשער שהבינה המלאכותית תוכל לבצע במעלה ההתפתחות שלה את מלאכתם.
עיתונאים, מידענים, תחקירנים, אנשי שיווק, פרסום ויוצרי תוכן, מתכנתים ואפילו מוסיקאים - אצל כולם השפה היא כלי מרכזי בו הם עושים שימוש בליבת שיטת העבודה. אז זה לא שלא יהיו עיתונאי-על, או מוסיקאים אנושיים - הם פשוט יהיו מעטים ומעולים. השאר ימצאו את עצמם מוקפים באנשים שאינם אנשי מקצוע, אך למדו לנצל כלי AI ולייצר תוצרים שייתחרו בשלהם.
גם אנשי מדיה צריכים לדעת שהמקצועות שלהם יעברו שינויים משמעותיים ולמעשה כבר עוברים. עורכי סרטים, צלמים, יוצרי סרטים, מקליטים, עובדי אולפנים, טכנאי סאונד, עורכי אפקטים ומעצבים גרפיים - המקצועות הללו כבר עוברים שינויים וכדאי שיתעדכנו בהם היטב כי כך יוכלו להשתנות עם התחום ולהתבגר לחידושי ה-AI שייכנסו אליו, למצוינות והובלה בו.
הנה השפעת הבינה המלאכותית על העולם האנושי שלנו (מתורגם):
https://youtu.be/RzkD_rTEBYs
יחליף את המורים? - למה בחינוך מודאגים ממודל השפה החדש?
https://youtu.be/Fn8jDanbf0c
האם הג'י פי טי יחליף למשל את הסופרים ויכתוב ספרים, כמו שהוא מייצר היום ספרי ילדים (עברית):
https://youtu.be/sDjFRAP0Szg
ומה הוא עושה לתלמידים והמורים (עברית):
https://youtu.be/vmmUiyeGNB8?long=yes
מהם סרטוני דיפ פייק ומה הבעיה בהם?
דיפ פייק (Deep fake או Deepfake) הוא שמה של טכנולוגיית וידאו, מבוססת בינה מלאכותית (AI), המאפשרת לייצר מציאות שנראית אמיתית ומבוססת על אנשים אמיתיים, אך לא התרחשה מעולם.
זה נעשה על ידי לקיחת תמונות, סרטונים וקולות ושינוי שלהם באמצעות AI, באופן שמאפשר לייצר תכנים דומים, הנראים אמיתיים, אך מעולם לא קרו, התרחשו או נאמרו באמת.
טכנולוגיה זו הולכת ותופסת בשנים האחרונות את מקומה ברשתות החברתיות שבאינטרנט.
העיקרון המוביל בסרטוני ה-Deepfakes הוא שחזורי פנים מדויקים, המולבשים על סרטוני וידאו, תמונות או אנימציה ומייצרים מראות הנראים אמיתיים לגמרי.
בסרטונים, למשל, מדובר על החלפת פניו של מי שצולם בווידאו, באמצעות למידת מכונה. התוצאה של זה היא יצירה בקלות של סרטוני וידאו המציגים אנשים העושים מעשים שמעולם לא עשו באמת או אומרים דברים שלא נאמרו.
#תולדות ה"דיפ פייק"
את לידת הטכנולוגיה הזו סימנה אפליקציה בשם FakeApp, שפותחה בסין על ידי מיזם בשם MoMo. המיזם היה ככל הנראה החלוץ בכך שאפשר להמונים להדביק את פניהם לזמרים, שחקנים ודמויות ממשחקי וידאו. לראשונה ראו המשתמשים שמספיקה תמונה אחת של פניהם, כדי שהאפליקציה תדביק ותמפה אותה באופן אוטומטי על גבי הקליפים שהיא מציעה.
בשנת 2016 כבר פותחו מערכות למידת מכונה אוטומטיות וחזקות יחסית, כאלה שלומדות ומשתפרות בעצמן, ככל שהן מופעלות. המערכות הללו חזרו שוב ושוב על תהליכי יצירת Deepfake וככל שהתהליך נמשך, לאחר מיליוני פעמים, הן שיפרו את התוצר. בשנה זו יצאו כבר תוכנות שאפשרו זאת גם על מחשבי PC ביתיים וחלשים יחסית.
את שמה קיבלה הטכנולוגיה הזו בשנת 2017, ממשתמש באתר Reddit שכינויו "זיופים עמוקים". הוא טבע את המונח לאחר שערך כמה סרטונים פורנוגרפיים ובהם הוא הטמיע, באמצעות טכנולוגיית "למידה עמוקה" (Deep learning), את פניהם של ידוענים ומפורסמים שונים.
את פרסומה העיקרי חייבת הטכנולוגיה הזו לסרטוני "פייק ניוז", חדשות כזב, שיצרו תומכי פוליטיקאים בארצות הברית, במהלך קמפיין הבחירות לנשיאות 2020. לפתע החלו להופיע סרטונים בהם ממליצים ומסבירים נשיאי עבר ומשפיענים פוליטיים שונים על דברים בדויים ומנוגדים לאמת. על התחום הזה שווה לקרוא בתגית "פייק ניוז".
#למה משמשים סרטונים אלו?
טכנולוגיית ה-Deepfake משמשת ליצירת תוכן וידאו המציג מציאות בדויה לחלוטין, דברים שנראים ונשמעים אמיתיים ומצולמים, אך למעשה לא התרחשו מעולם.
ביטויי הסרטונים הללו, שזכו לכינוי Deepfakes, הם רבים. הם מתחילים מפוליטיקה בה מיוצרים כך נאומים שלא ננאמו ומעבירים מסרים בדויים מפיהם של ידוענים, מנהיגים ומפורסמים ומסתיימים כיום בסרטונים "פסאודו-תיעודיים", המציגים מעשים, מראות וטקסטים מדוברים, הנראים אמיתיים לחלוטין אך מעולם לא צולמו והוקלטו.
מדובר בעניין מהפכני. מעולם לא עמדה טכנולוגיה כה חזקה וריאליסטית לטובת תעשיית השקר, או בשמה המכובס, תעשיית ה"פוסט אמת".
בעולם של ה-Deepfakes השתפרו האפשרויות ליצירה והפצה של שקרים פראיים. הן כה מרשימות, עד כדי כך שמיליונים "נופלים בפח", מאמינים לסרטוני הדיפ פייק הללו ומשנים בגללם את דעותיהם ואף את התנהגותם והעדפותיהם הפוליטיות. ראו את סרטון הטבע שאנו מציגים למטה ובו בעלי חיים בדויים וכמה שהוא נראה אמיתי.
#סיכום
הכלים ליצירת סרטוני ה"דיפ פייקס" הם כלים טכנולוגיים, מתוחכמים מכל טכנולוגיה שעמדה בעבר לטובת השקרנים ומקדמי מה שזכה לכינויים כמו "אמת אלטרנטיבית", תיאוריות קונספירציה וכדומה.
מעולם לא עמדו טכנולוגיות כה חזקות לרשות השקרים הקטנים, להם מתאפשר עתה להמציא ולהפיק את הבדיות שלהם באופן מוחשי וריאליסטי מאי-פעם.
מצד שני, מעולם הדיפ פייק נולד עם הזמן גם יישום ה"דיפ נוסטלגיה". עד שימצאו גם לו שימושים מזיקים ואף מחרידים, זהו עולם חיובי, סנטימנטלי ומעורר התרגשות אמיתי, בהנחה שנוסטלגיה אינה מזיקה לאיש. ניתן לקרוא עליו בתגית "דיפ נוסטלגיה".
הסבר לטכנולוגיה (עברית):
https://youtu.be/lk-1hBpAyiU
אובמה מדבר פייק:
https://youtu.be/gLoI9hAX9dw
סרט טבע פיקטיבי שיצרו בעזרת Sora ומציג פייק חיות:
https://youtu.be/ObUBUKOn-bo
ההשלכות של זה מטורפות (עברית):
https://youtu.be/4BsiYnt51ok
כך יוצרים פנים ממאפיינים או שילובי פנים אמיתיים:
https://youtu.be/kSLJriaOumA
שעשוע עם טראמפ ומיסטר בין:
https://youtu.be/HN-qlGf2mZw
וקצת מוסיקה מצמד הנשיאים וחתול:
https://youtu.be/dsODRfCMRoM
דיפ פייק (Deep fake או Deepfake) הוא שמה של טכנולוגיית וידאו, מבוססת בינה מלאכותית (AI), המאפשרת לייצר מציאות שנראית אמיתית ומבוססת על אנשים אמיתיים, אך לא התרחשה מעולם.
זה נעשה על ידי לקיחת תמונות, סרטונים וקולות ושינוי שלהם באמצעות AI, באופן שמאפשר לייצר תכנים דומים, הנראים אמיתיים, אך מעולם לא קרו, התרחשו או נאמרו באמת.
טכנולוגיה זו הולכת ותופסת בשנים האחרונות את מקומה ברשתות החברתיות שבאינטרנט.
העיקרון המוביל בסרטוני ה-Deepfakes הוא שחזורי פנים מדויקים, המולבשים על סרטוני וידאו, תמונות או אנימציה ומייצרים מראות הנראים אמיתיים לגמרי.
בסרטונים, למשל, מדובר על החלפת פניו של מי שצולם בווידאו, באמצעות למידת מכונה. התוצאה של זה היא יצירה בקלות של סרטוני וידאו המציגים אנשים העושים מעשים שמעולם לא עשו באמת או אומרים דברים שלא נאמרו.
#תולדות ה"דיפ פייק"
את לידת הטכנולוגיה הזו סימנה אפליקציה בשם FakeApp, שפותחה בסין על ידי מיזם בשם MoMo. המיזם היה ככל הנראה החלוץ בכך שאפשר להמונים להדביק את פניהם לזמרים, שחקנים ודמויות ממשחקי וידאו. לראשונה ראו המשתמשים שמספיקה תמונה אחת של פניהם, כדי שהאפליקציה תדביק ותמפה אותה באופן אוטומטי על גבי הקליפים שהיא מציעה.
בשנת 2016 כבר פותחו מערכות למידת מכונה אוטומטיות וחזקות יחסית, כאלה שלומדות ומשתפרות בעצמן, ככל שהן מופעלות. המערכות הללו חזרו שוב ושוב על תהליכי יצירת Deepfake וככל שהתהליך נמשך, לאחר מיליוני פעמים, הן שיפרו את התוצר. בשנה זו יצאו כבר תוכנות שאפשרו זאת גם על מחשבי PC ביתיים וחלשים יחסית.
את שמה קיבלה הטכנולוגיה הזו בשנת 2017, ממשתמש באתר Reddit שכינויו "זיופים עמוקים". הוא טבע את המונח לאחר שערך כמה סרטונים פורנוגרפיים ובהם הוא הטמיע, באמצעות טכנולוגיית "למידה עמוקה" (Deep learning), את פניהם של ידוענים ומפורסמים שונים.
את פרסומה העיקרי חייבת הטכנולוגיה הזו לסרטוני "פייק ניוז", חדשות כזב, שיצרו תומכי פוליטיקאים בארצות הברית, במהלך קמפיין הבחירות לנשיאות 2020. לפתע החלו להופיע סרטונים בהם ממליצים ומסבירים נשיאי עבר ומשפיענים פוליטיים שונים על דברים בדויים ומנוגדים לאמת. על התחום הזה שווה לקרוא בתגית "פייק ניוז".
#למה משמשים סרטונים אלו?
טכנולוגיית ה-Deepfake משמשת ליצירת תוכן וידאו המציג מציאות בדויה לחלוטין, דברים שנראים ונשמעים אמיתיים ומצולמים, אך למעשה לא התרחשו מעולם.
ביטויי הסרטונים הללו, שזכו לכינוי Deepfakes, הם רבים. הם מתחילים מפוליטיקה בה מיוצרים כך נאומים שלא ננאמו ומעבירים מסרים בדויים מפיהם של ידוענים, מנהיגים ומפורסמים ומסתיימים כיום בסרטונים "פסאודו-תיעודיים", המציגים מעשים, מראות וטקסטים מדוברים, הנראים אמיתיים לחלוטין אך מעולם לא צולמו והוקלטו.
מדובר בעניין מהפכני. מעולם לא עמדה טכנולוגיה כה חזקה וריאליסטית לטובת תעשיית השקר, או בשמה המכובס, תעשיית ה"פוסט אמת".
בעולם של ה-Deepfakes השתפרו האפשרויות ליצירה והפצה של שקרים פראיים. הן כה מרשימות, עד כדי כך שמיליונים "נופלים בפח", מאמינים לסרטוני הדיפ פייק הללו ומשנים בגללם את דעותיהם ואף את התנהגותם והעדפותיהם הפוליטיות. ראו את סרטון הטבע שאנו מציגים למטה ובו בעלי חיים בדויים וכמה שהוא נראה אמיתי.
#סיכום
הכלים ליצירת סרטוני ה"דיפ פייקס" הם כלים טכנולוגיים, מתוחכמים מכל טכנולוגיה שעמדה בעבר לטובת השקרנים ומקדמי מה שזכה לכינויים כמו "אמת אלטרנטיבית", תיאוריות קונספירציה וכדומה.
מעולם לא עמדו טכנולוגיות כה חזקות לרשות השקרים הקטנים, להם מתאפשר עתה להמציא ולהפיק את הבדיות שלהם באופן מוחשי וריאליסטי מאי-פעם.
מצד שני, מעולם הדיפ פייק נולד עם הזמן גם יישום ה"דיפ נוסטלגיה". עד שימצאו גם לו שימושים מזיקים ואף מחרידים, זהו עולם חיובי, סנטימנטלי ומעורר התרגשות אמיתי, בהנחה שנוסטלגיה אינה מזיקה לאיש. ניתן לקרוא עליו בתגית "דיפ נוסטלגיה".
הסבר לטכנולוגיה (עברית):
https://youtu.be/lk-1hBpAyiU
אובמה מדבר פייק:
https://youtu.be/gLoI9hAX9dw
סרט טבע פיקטיבי שיצרו בעזרת Sora ומציג פייק חיות:
https://youtu.be/ObUBUKOn-bo
ההשלכות של זה מטורפות (עברית):
https://youtu.be/4BsiYnt51ok
כך יוצרים פנים ממאפיינים או שילובי פנים אמיתיים:
https://youtu.be/kSLJriaOumA
שעשוע עם טראמפ ומיסטר בין:
https://youtu.be/HN-qlGf2mZw
וקצת מוסיקה מצמד הנשיאים וחתול:
https://youtu.be/dsODRfCMRoM
מהי טכנולוגיית הדיפ נוסטלגיה?
בשנים האחרונות הולכת ותופסת את מקומה טכנולוגיה מבוססת בינה מלאכותית (AI) שנקראת דיפ פייק (Deepfake). טכנולוגיה זו משמשת לייצור או שינוי תוכן וידאו כך שהיא מציגה מציאות שלמעשה לא התרחשה מעולם. מנאומים שלא ננאמו מעבירים מסרים בדויים מפיהם לכאורה, של אנשים מפורסמים ועד סרטונים "פסאודו-תיעודיים", שמציגים מראות וטקסטים מדוברים, שנראים אמיתיים אך מעולם לא צולמו והוקלטו.
ענף חדש בעולם הדיפ פייק הוא יישום שזכה לשם "דיפ נוסטלגיה" (™Deep Nostalgia), המנפיש את פניהם של אנשים שצולמו בתמונות ישנות או היסטוריות, ומזיז את פניהם, כאילו צולמו בווידאו.
הטכנולוגיה הזו פועלת על כל תמונת סטילס (תמונות קפואות), כולל תמונות בשחור-לבן ותמונות שצולמו בצבע.
השם ניתן ליישום פורץ דרך זה על ידי חברת MyHeritage, שעוסקת בפיתוח טכנולוגיה ליצירת עצי משפחה מקוונים.
סרטוני הדיפ נוסטלגיה התפרסמו כשאנשים שיתפו עם בני משפחתם וחבריהם סרטונים קצרים ומונפשים שנוצרו כך, ובהם קרוביהם ואבותיהם מזיזים את ראשיהם, מצמצים, מחייכים ונעים בצורה ריאליסטית כמעט לחלוטין.
#איך פועלת הדיפ נוסטלגיה?
דיפ נוסטלגיה מחזירה, אם כן, לחיים אנשים שצולמו בצילומי סטילס. זה מתחיל באיתור פני המצולמים בתמונות ואז הפקה של מחוות ותנועות מציאותיות, ממש כאילו צולמו בווידאו. ההנפשה של הפנים בתמונות הסטילס מראה אותם מחייכים, זזים וממצמצים, כאילו צולמו כך במקור.
בבסיס הטכנולוגי של יישום ה"דיפ נוסטלגיה" פועל אלגוריתם למידה עמוקה (Deep Learning), המחבר בין תווי הפנים של המצולמים לבין אוסף מחוות שצולמו בווידאו ושמורים במאגר החברה.
פיתוח וצילום אותן מחוות נעשה כשצילמו אנשי מיי הריטג' מראש שלל מקטעי וידאו של שחקנים ועובדי החברה, המזיזים את ראשיהם ופניהם באורח טבעי, ממצמצים, מחייכים ומפנים את ראשם לכיוונים שונים.
למעשה שכרה חברת MyHeritage רישיון מחברת D-ID, לטכנולוגיה שפותחה בה ומאפשרת שחזור, באמצעות טכנולוגיית למידה עמוקה, של סרטוני וידאו.
על מנת שאפקט ההנפשה יופעל על התמונות, ברזולוציה הכי גבוהה האפשרית, עוברות תמונות מטושטשות חידוד אוטומטי, שמבצעת הטכנולוגיה החדשנית, מה שמעלה באופן דרמטי את איכות הסרטונים המופקים בה.
ההברקה האמיתית של הטכנולוגיה הזו נעוצה בזיהוי והבחירה האוטומטית שמבצע יישום הדיפ נוסטלגיה, מבין מקטעי המחוות בווידאו. ניתוח מהיר של מנח הראש וכיוון העיניים של המצולמים בתמונה מאפשרים ליישום להתאים להם באופן חכם את מחוללי ההנפשה המיטביים ולייצר את הסרטונים המונפשים באופן אופטימלי.
#ממה נמנעו מפתחי הדיפ נוסטלגי?
אנשי חברת MyHeritage ומפתחי היישום המלהיב נמנעו מהוספת דיבור לסרטונים.
לאור העובדה שטכנולוגיית הדיפ פייק ידועה ביכולות המטורפות שלה, גם בתחום הדיבור, נשאלת השאלה מדוע. הרי ניתן היה לשתול בפי המצולמים טקסטים מדוברים, שהיו נשמעים אמיתיים, על אף שמעולם לא צולמו והוקלטו.
ראשית, חשוב לומר שזיהוי קולי של המצולמים, ככל שמדובר באנשים שקרוביהם זוכרים עדיין את קולם האמיתי, היה מפחית את אפקט המציאות שיוצרים הסרטונים הללו.
אבל יש עוד סיבה לכך.
ב-MyHeritage מציינת שההימנעות מאפקטים קוליים של דיבור היא מכוונת. מטרתה, הם מטעימים, היא "למנוע שימושים זדוניים בכלי", דוגמת אלה שנעשים בסרטוני "דיפ פייק" של פוליטיקאים וידוענים שעודם בחיים.
לכן הם גם מבקשים מהמשתמשים לעשות בכלי שימוש רק על תמונות היסטוריות השייכות להם ולהימנע משימוש בתמונות של אנשים חיים, שלא אישרו את השימוש הזה.
הסבר לטכנולוגיה (עברית):
https://youtu.be/O4VPN_YjgIM?t=21s
הנה הדיפ נוסטלגיה:
https://youtu.be/tjBYSnoAWqg
ציורים מפורסמים שקמים לתחייה:
https://youtu.be/TWY1uBK4Zxc
ואפילו דיקטטורים קמים לתחיה עם הדיפ נוסטלגיה של מיי הריטג':
https://youtu.be/a-HR03bToew
בשנים האחרונות הולכת ותופסת את מקומה טכנולוגיה מבוססת בינה מלאכותית (AI) שנקראת דיפ פייק (Deepfake). טכנולוגיה זו משמשת לייצור או שינוי תוכן וידאו כך שהיא מציגה מציאות שלמעשה לא התרחשה מעולם. מנאומים שלא ננאמו מעבירים מסרים בדויים מפיהם לכאורה, של אנשים מפורסמים ועד סרטונים "פסאודו-תיעודיים", שמציגים מראות וטקסטים מדוברים, שנראים אמיתיים אך מעולם לא צולמו והוקלטו.
ענף חדש בעולם הדיפ פייק הוא יישום שזכה לשם "דיפ נוסטלגיה" (™Deep Nostalgia), המנפיש את פניהם של אנשים שצולמו בתמונות ישנות או היסטוריות, ומזיז את פניהם, כאילו צולמו בווידאו.
הטכנולוגיה הזו פועלת על כל תמונת סטילס (תמונות קפואות), כולל תמונות בשחור-לבן ותמונות שצולמו בצבע.
השם ניתן ליישום פורץ דרך זה על ידי חברת MyHeritage, שעוסקת בפיתוח טכנולוגיה ליצירת עצי משפחה מקוונים.
סרטוני הדיפ נוסטלגיה התפרסמו כשאנשים שיתפו עם בני משפחתם וחבריהם סרטונים קצרים ומונפשים שנוצרו כך, ובהם קרוביהם ואבותיהם מזיזים את ראשיהם, מצמצים, מחייכים ונעים בצורה ריאליסטית כמעט לחלוטין.
#איך פועלת הדיפ נוסטלגיה?
דיפ נוסטלגיה מחזירה, אם כן, לחיים אנשים שצולמו בצילומי סטילס. זה מתחיל באיתור פני המצולמים בתמונות ואז הפקה של מחוות ותנועות מציאותיות, ממש כאילו צולמו בווידאו. ההנפשה של הפנים בתמונות הסטילס מראה אותם מחייכים, זזים וממצמצים, כאילו צולמו כך במקור.
בבסיס הטכנולוגי של יישום ה"דיפ נוסטלגיה" פועל אלגוריתם למידה עמוקה (Deep Learning), המחבר בין תווי הפנים של המצולמים לבין אוסף מחוות שצולמו בווידאו ושמורים במאגר החברה.
פיתוח וצילום אותן מחוות נעשה כשצילמו אנשי מיי הריטג' מראש שלל מקטעי וידאו של שחקנים ועובדי החברה, המזיזים את ראשיהם ופניהם באורח טבעי, ממצמצים, מחייכים ומפנים את ראשם לכיוונים שונים.
למעשה שכרה חברת MyHeritage רישיון מחברת D-ID, לטכנולוגיה שפותחה בה ומאפשרת שחזור, באמצעות טכנולוגיית למידה עמוקה, של סרטוני וידאו.
על מנת שאפקט ההנפשה יופעל על התמונות, ברזולוציה הכי גבוהה האפשרית, עוברות תמונות מטושטשות חידוד אוטומטי, שמבצעת הטכנולוגיה החדשנית, מה שמעלה באופן דרמטי את איכות הסרטונים המופקים בה.
ההברקה האמיתית של הטכנולוגיה הזו נעוצה בזיהוי והבחירה האוטומטית שמבצע יישום הדיפ נוסטלגיה, מבין מקטעי המחוות בווידאו. ניתוח מהיר של מנח הראש וכיוון העיניים של המצולמים בתמונה מאפשרים ליישום להתאים להם באופן חכם את מחוללי ההנפשה המיטביים ולייצר את הסרטונים המונפשים באופן אופטימלי.
#ממה נמנעו מפתחי הדיפ נוסטלגי?
אנשי חברת MyHeritage ומפתחי היישום המלהיב נמנעו מהוספת דיבור לסרטונים.
לאור העובדה שטכנולוגיית הדיפ פייק ידועה ביכולות המטורפות שלה, גם בתחום הדיבור, נשאלת השאלה מדוע. הרי ניתן היה לשתול בפי המצולמים טקסטים מדוברים, שהיו נשמעים אמיתיים, על אף שמעולם לא צולמו והוקלטו.
ראשית, חשוב לומר שזיהוי קולי של המצולמים, ככל שמדובר באנשים שקרוביהם זוכרים עדיין את קולם האמיתי, היה מפחית את אפקט המציאות שיוצרים הסרטונים הללו.
אבל יש עוד סיבה לכך.
ב-MyHeritage מציינת שההימנעות מאפקטים קוליים של דיבור היא מכוונת. מטרתה, הם מטעימים, היא "למנוע שימושים זדוניים בכלי", דוגמת אלה שנעשים בסרטוני "דיפ פייק" של פוליטיקאים וידוענים שעודם בחיים.
לכן הם גם מבקשים מהמשתמשים לעשות בכלי שימוש רק על תמונות היסטוריות השייכות להם ולהימנע משימוש בתמונות של אנשים חיים, שלא אישרו את השימוש הזה.
הסבר לטכנולוגיה (עברית):
https://youtu.be/O4VPN_YjgIM?t=21s
הנה הדיפ נוסטלגיה:
https://youtu.be/tjBYSnoAWqg
ציורים מפורסמים שקמים לתחייה:
https://youtu.be/TWY1uBK4Zxc
ואפילו דיקטטורים קמים לתחיה עם הדיפ נוסטלגיה של מיי הריטג':
https://youtu.be/a-HR03bToew