» «
למידה עמוקה
מה ההבדל בין למידת מכונה ללמידה עמוקה?



הלמידה העמוקה (Deep Learning) היא טכנולוגיה שמאפשרת למערכות מחשב לחקות את פעולת המוח האנושי ולבצע למידה עצמית, תוך שיפור מתמיד המאפשר למערכת להיות חכמה יותר ויותר כל הזמן.

אבל מה ההבדל בין למידה עמוקה ללמידת מכונה?

אז ראשית, מבחינת מיון - דיפ לרנינג, בעברית למידה עמוקה, הוא תת-תחום של למידת מכונה.

אבל בעוד שב"למידת מכונה" (Machine Learning) קלאסית הלימוד הוא מתוך דאטה שתויג ואורגן מראש לשם כך, על ידי מי שמאמן את המכונה, בעזרת מה שנקרא "דאטה מתויג" (Labeled data), "למידה עמוקה" (Deep Learning) לומדת בעצמה - עם דאטה כמותי, כלומר מידע רב ולא מאורגן. למשל המוני דוגמאות לא מזוהות או מסודרות דווקא הניתנות לתוכנת הלמידה העמוקה והיא מייצרת את הסיווג וה"הבנה" של הדפוסים והסדר, שמאפשרים לה בהדרגה "להבין" את הדאטה הזה ולהפוך אותו לתובנות וידע, שגם הולך ומשתפר כל הזמן, כמו ילד שכל הזמן לומד דברים חדשים ורוכש תובנות טובות יותר על המציאות והחוקים ששוררים בה.

אם למידת מכונה זו למידת בית ספר, ממישהו שמלמד אותך ומתרגל אותך בלמידה, למידה עמוקה היא הלימוד אחרי שעת הלימודים - בשכונה, מתוך התבוננות, סקרנות ועיבוד נתונים עצמי.

משום כך, ככל שמערכת למידה עמוקה פועלת וככל שהיא בשימוש - היא משתפרת, יודעת יותר ויכולה לבצע משימות מורכבות יותר ובהצלחה הולכת וגדלה.

אז ההבדל בין למידה עמוקה ללמידת מכונה הוא בסיסי. בלמידת מכונה, כדי ללמוד ולהשתפר המערכת הממוחשבת צריכה מומחה אנושי, שיאתר תכונות מסוימות שעל פיהן הוא מאמן את המכונה או התוכנה.

בלמידה עמוקה, לעומת זאת, לא נדרשים בהכרח מי שיבצעו את האימון והארגון, התיוג והסידור של המידע בכדי שהמכונה תלמד. פשוט מזינים אליה המוני מקרים, למשל תמונות לזיהוי או מידע לניתוח, ונותנים לתוכנה לאתר בהם מאפיינים, הבדלים, דפוסים וכדומה. כך היא תזהה בעתיד דברים בתמונות או המלצות לשימוש במידע וכדומה. כך היא תלמד את עצמה כל הזמן ותהפוך יותר ויותר חכמה.

זה אולי גם קצת דומה לשני טיפוסי מורים. יש את המורים שמתעקשים להגיש לתלמידים את הידע "בכפית" ולהראות להם על מה להביט בלמידה, בעוד אחרים, נקרא להם "המלמדים העמוקים", נותנים לתלמידים לאתר את ההבדלים, להעלות השערות לגבי דפוסי מידע וחלוקה, להסיק מסקנות וכדומה.

אז כך, ממש כמו התלמידים אצל "המורה העמוק", תוכנת הלמידה העמוקה מקבלת בלמידה כזו המון "הזדמנויות" ללמוד בעצמה ולהתבגר. זאת במקום האימון על ידי אדם, שמתבטא בהוראות ואימון הממחישים לתוכנה מה לחפש בדאטה, כדי להבחין בין המקרים.

זו, אגב, גם הביקורת של המדענים על השיטה הזו. הם גורסים שלא נדרש עוד ממדענים להבין בעיה כדי לפתור אותה, מה שמביא לרדידות ולפתרון בעיות בניסוי וטעייה טכנולוגיים, במקום באמצעות תיאוריות מעמיקות ובחינתן באופן מדעי.


הנה הסבר פשוט של הלמידה העמוקה:

https://youtu.be/6M5VXKLf4D4


למידה עמוקה מחייבת יותר זמן, יותר דאטה ויותר כוח מחשוב מלמידת מכונה:

https://youtu.be/-SgkLEuhfbg


כך הולך ומתפתח עץ ההחלטות המשתפר של מערכת הלמידה העמוקה:

http://youtu.be/nSg4HKHdDs4


שיעור וידאו קצר על שיטות הלמידה השונות (עברית):

https://youtu.be/Bqdn6e-nH18?long=yes


והרצאה אקדמית על למידה עמוקה (עברית):

https://youtu.be/z-aezi4W90o?long=yes
למידה עמוקה
מהי למידה עמוקה?



הלמידה העמוקה (Deep Learning) היא תחום מחקר בעולם המחשבים וספציפית בתחום "למידת המכונה" שמניח שהמחשב יכול ללמוד וללמד את עצמו, ממש כמו המוח האנושי. מטרתו הברורה של התחום הזה היא ליצור חיקוי ממוחשב של פעולת המוח האנושי.

בין שנות ה-70 לאמצע שנות ה-2000, רווחה אכזבה מאד גדולה מהביצועים של תחום הבינה המלאכותית. התחום, שהבטיח מהפכה של ממש בעולם המחשוב ו"לא סיפק את הסחורה", אכזב במידה רבה והמחקר שלו נכנס לתקופה שכונתה אז "החורף של הבינה המלאכותית".

אבל בשלב מסוים, בשנות האלפיים ואחרי שנים רבות של האכזבה, הפציעה האינטליגנציה המלאכותית מחדש, כשהפעם היא החלה לממש סוף כל סוף את ההבטחה מימי התום שלה. מחשבים מהירים פי מיליון, כמויות מידע עצומות שהחל להציע האינטרנט ושנאגרו על כונני ענק זולים ונגישים - כל אלה הבשילו ביחד עם הבשלה של טכנולוגיה חזקה ומעשית מאי-פעם - "הלמידה העמוקה". הרעיון בה, בפשטות, הוא לפתח "מוח ממוחשב", על בסיס המוח האנושי, תחת הרעיון שהמוח הוא סדרת רכיבים , שלכל אחד מהם תפקיד עצמאי והם מחוברים ביניהם.

ה"הלמידה העמוקה" היא תת-תחום בתוך תחום "למידת המכונה", שגם הוא עצמו, כמו שאומרים מקצועני תחום "למידת המכונה" (ML), מהווה תת-תחום מרכזי בעולם האינטליגנציה המלאכותית.

המיוחד במערכות "למידה עמוקה" הוא היכולת שלהן ללמוד ולהשתפר כל הזמן ולעשות את הלמידה והשיפור המתמיד לגמרי בעצמן. מפתחי מערכות כאלה בונים בשבילה מעין "רשת סמנטית". זו מערכת שמחקה את המערכת הנוירונים שבמוח האנושי וכאמור פועלת ולומדת כמוהו - ככל שהיא פועלת וככל שמשתמשים בה - היא משתפרת ו"יודעת" יותר.

מדובר בתחום חדש יחסית בעולם של חקר המערכות הלומדות, או "למידת המכונה". הוא נקרא גם "הלמידה החישובית" (Machine Learning) והרעיון החדשני בו היה שב"למידה עמוקה" המכונה לומדת בעצמה, מבלי שיאמנו אותה כמו שעושים בלמידה מכונה רגילה.

לטווח רחוק מטרת התחום היא פיתוח של מחשב שיוכל להחליף את החשיבה האנושית. מערכת כזו תהיה מסוגלת לזהות תבניות ודפוסים בדיבור, תמונות, צלילים ועוד סוגי מידע, שהמערכות הממוחשבות התקשו, עד לא מזמן, לעבד ולטפל בהם.

חשיבה עמוקה היא רק בתחילתה, אבל חוקרים נעזרו בה כבר לזיהוי מולקולות שייקשרו למטרות בגוף טוב יותר ומסתייעים בממצאים לפיתוח תרופות חדשות. מחשב או תוכנה שמצוידים ב"חשיבה עמוקה" מבינים כבר היום שפה אנושית במנועי חיפוש, בחיפוש קולי ובעוזרים דיגיטליים כמו "סירי" של חברת אפל ו"קורטנה" של מיקרוסופט. בעתיד יסיקו מערכות כאלה גם מסקנות ויקבלו החלטות בכוחות עצמן.

העתיד מבטיח מפיתוחים אלה מערכות רפואיות שמטפלות בחולים, אנליסטים ומומחים ממוחשבים לניהול כספים ומסחר במניות ועד למערכות ראיה ממוחשבת, שיוכלו לזהות עצמים במרחב ולסווג אותם, ללא צורך בהתערבות אנושית.

באמצעות חיקוי היכולת האנושית ללמוד, מצליחות מערכות למידה עמוקה גם ליצור ציורים, מוסיקה, סרטונים וטקסטים,להמליץ ללקוחות על רכישות, לייצר קריינות מלאכותית, לזהות עצמים ופנים מדויקות בתמונות וסרטונים, לאבחן מחלות, להפיק רווחים ממניות, להלביש פנים של מפורסמים על סרטי וידאו ועוד שלל יישומים.


המלצה:
======
קראו באאוריקה בתגית "Google Brain", על אחד מפרויקטי הבינה המלאכותית הגדולים ביותר אי פעם.


הנה טכנולוגיית הלמידה העמוקה והעתיד שהיא מסמנת, כולל הסכנות האפשריות:

http://youtu.be/IoP9akd44wk


כך עובדים על פיתוח המוח העמוק:

http://youtu.be/zLp-edwiGUU


הדגמה ויזואלית של עץ ההחלטות הגדל ומתפתח של מערכת חכמה:

http://youtu.be/nSg4HKHdDs4
Google Brain
מהי מערכת הלמידה העמוקה של גוגל?



למידת מכונה היא תחום שנחקר כבר עשרות שנים. בשנים האחרונות הוא הולך ומתפתח לכיוון של למידה עמוקה. מערכת הלמידה העמוקה הגדולה והמתקדמת בעולם כיום היא ה-Google Brain. זהו אחד מפרויקטי הבינה המלאכותית הגדולים בעולם. הפרויקט מנסה לפתח מוח ממוחשב מ-16,000 ליבות מחשבים ותוכנת מחשב שלומדת מתוך דוגמאות ומסיקה מסקנות בעצמה, תוך כדי התמודדות עם בעיות מורכבות במיוחד. משאבי המחשב שמוקדשים לפיתוח זה הם עצומים וכך גם התקציבים שחברת הענק משקיעה במחקר והפיתוח, כולל גיוס האנשים המתקדמים בעולם בתחום זה ושל המדען והעתידן הגאון ריי קורצווייל, שהסכים לעמוד בראש הפרויקט.

אבל למה גוגל צריכה מערכת למידה עמוקה? - היות ופיתוח של רשתות מחשב מבוססות נוירונים עולה המון כסף, חברת גוגל בעלת המיליארדים היא מהיחידות בעולם שיכולות להקצות משאבים לנושא. לרשת שמאפשרת את הלמידה של המחשב העמוק מוקצים עוד ועוד מחשבים. רק כך ניתן לדמות את אופן הפעולה של המוח האנושי.

וזה עוד כלום. ברצונם להגיע למאה טריליון קישורים בין נוירונים במחשב העל של גוגל, מגייסת החברה את מיטב חידושי הטכנולוגיה שיוצאים לשוק, כולל מעבדים מקביליים ומהירים ביותר, כרטיסי מסך גרפיים המכונים "GPU" ושפותחו עבור תעשיית המשחקים, ועד רכיבי מחשוב קוונטי. גוגל כה רצינית בשאיפות שלה בתחום זה, שהיא רוכשת חברות קטנות שעוסקות בתחום וכך קונה הן את הטכנולוגיות והידע שהן צברו והן את כוח האדם המעולה שלהן.


המלצה:
======
בתגית "למידה עמוקה" תוכלו לקרוא על עולם הבינה המלאכותית, המתבססת על רשת נוירונים כמו זו שבונה גוגל. שווה לקרוא גם בתגית "רשתות נוירונים".


הנה למידת המכונה:

https://youtu.be/59bMh59JQDo


כך מתבצעים פרויקטי הבינה המלאכותית הגדולים של גוגל ומתחרותיה:

https://youtu.be/gB_-LabED68


כך מסייעים מוחות טכנולוגיים עם למידה עמוקה לעולם להתקדם:

https://youtu.be/Dy0hJWltsyE


סרטון עם מתיחה שבה גוגל הולכים להחליף את המוח האנושי:

https://youtu.be/fV52J7_7gss


ופרוייקט הגוגל בוקס והבעיות שהוא עורר:

https://youtu.be/5_EyoyHLnLI
רשת סמנטית
מהן רשתות סמנטיות?



רשתות סמנטיות (Semantic networks) הן שיטה להכנת מפות מידע, שבה מסומנים ומוגדרים הקשרים בין המושגים השונים. רשת סמנטית מיועדת למיפוי לפי משמעות ועל פי הקשרים בין מרכיבים שונים בה (מיפוי סמנטי). שימוש ברשת מושגית מתקדמת שכזו יכול לסייע בתהליכי חשיבה, סיעור מוחין וקבלת החלטות.

המידע ברשת סמנטית מאורגן לפי מושגים שמיוצגים במילה או במשפט ומקושרים למושג מרכזי. נכנה את המושגים "צמתים". בין כל צומת לאחרות יש קשרים, שהם בעצם קשרים אל המושגים הקרובים אליה משמעותית. רשת כזו ניתן לבנות לדוגמה סביב המושג המרכזי "אריה". קשרים יחברו בינו לבין מושגים קרובים כמו: טורפים, יונקים, חתולים גדולים, חיות פרא, אוכל בשר, אפריקה וכדומה. לכל קשר יהיה את התפקיד והמשמעות שלו וצבעים שונים יכולים לבטא את סוג הקשר בין מושגים.

שרטוט רשתות סמנטיות מאפשר תהליך למידה. זה קורה בשילוב שאנו עושים בין הדברים הידועים לנו בטרם הלמידה, לבין הדברים שנלמד תוך כדי השילוב של ידע חדש ברשת הסמנטית. קשרים שלא נדע להסביר את טיבם ומושגים ללא קשרים ביניהם יצביעו על מה שדורש למידה נוספת ומעמיקה יותר. בהנחה שחקר ולמידה כאלו אכן יבוצעו ויקרו, ההבנה של המושגים והקשרים שביניהם היא הלמידה.

בשנים האחרונות הפך נושא הרשת הסמנטית לתחום חם גם בעולם הטכנולוגיה. זאת לאחר שהסתבר שרשת כזו יכולה להוות בסיס למערכות בינה מלאכותית ולשיפור רשת האינטנרט ומנועי החיפוש. המחקר המדעי בעולם עוסק לא מעט במיפוי סמנטי לצורכי המיחשוב ובמקביל התפתח חזון הווב הסמנטי, שמציג רשת עתידית, מבוססת משמעות ובעלת יכולות רבות לשיפור האינטרנט (קראו עליה באאוריקה בתגית "ווב סמנטי").


משימת התנסות
===========
הכינו רשת סמנטית על המושג "מחשב", בכתיבת המושג, המושגים הקרובים והמושגים שנובעים מהם ויצירת הקשרים ביניהם על גבי נייר.


הנה הרשת הסמנטית:

https://youtu.be/3wMfKTkYemY

למידה עמוקה

ניסוי החתולים
מהו ניסוי החתולים של גוגל?



כשרוצים ללגלג על יוטיוב והרשת, תמיד מדברים על סרטונים טפשיים של חתולים. אבל האמת היא שניתן לעשות באמצעותם לא מעט. בשנת 2012 הצליחה חברת גוגל להוכיח את היכולת של מערכת הלמידה העמוקה שלה באופן משמעותי. לאחר שהוכיחה שצפייה ב-10 מיליון תמונות מסרטוני יוטיוב, הביאה אותה ליכולת טובה פי שניים מניסיונות קודמים בזיהוי עצמים כמו חתולים בתמונות.

בכך הצליחה לראשונה תוכנה חכמה לחבר באופן לוגי בין תמונה למילה. היכולת לזהות באופן עצמאי את הקשר בין המידע הויזואלי למילה חתול הוא שלב מרשים בצעידה לכיוון של הבינה המלאכותית והלמידה העמוקה. במדעי המוח מזוהה שלב זה עם שלב דומה בלמידה של התינוק. בשלבי הלמידה הראשונים שלו הוא לומד לזהות עצמים עם מילים שלמד מהוריו.


הנה תיאור הניסוי של הלמידה העמוקה בגוגל לזהות חתולים בסרטונים:

https://youtu.be/TK4qLwTye_s


הומור סרקסטי על העובדה שהמוח של גוגל יהפוך בסוף לטיפש מעודף צפייה בסרטוני חתולים ברשת:

https://youtu.be/lWijWH8VnlA


והרצאת טד עם ראייה חכמה וההתקדמות המדהימה שלה (מתורגם):

https://youtu.be/40riCqvRoMs?long=yes
דיפ נוסטלגיה
מהי טכנולוגיית הדיפ נוסטלגיה?



בשנים האחרונות הולכת ותופסת את מקומה טכנולוגיה מבוססת בינה מלאכותית (AI) שנקראת דיפ פייק (Deepfake). טכנולוגיה זו משמשת לייצור או שינוי תוכן וידאו כך שהיא מציגה מציאות שלמעשה לא התרחשה מעולם. מנאומים שלא ננאמו מעבירים מסרים בדויים מפיהם לכאורה, של אנשים מפורסמים ועד סרטונים "פסאודו-תיעודיים", שמציגים מראות וטקסטים מדוברים, שנראים אמיתיים אך מעולם לא צולמו והוקלטו.

ענף חדש בעולם הדיפ פייק הוא יישום שזכה לשם "דיפ נוסטלגיה" (™Deep Nostalgia), המנפיש את פניהם של אנשים שצולמו בתמונות ישנות או היסטוריות, ומזיז את פניהם, כאילו צולמו בווידאו.

הטכנולוגיה הזו פועלת על כל תמונת סטילס (תמונות קפואות), כולל תמונות בשחור-לבן ותמונות שצולמו בצבע.

השם ניתן ליישום פורץ דרך זה על ידי חברת MyHeritage, שעוסקת בפיתוח טכנולוגיה ליצירת עצי משפחה מקוונים.

סרטוני הדיפ נוסטלגיה התפרסמו כשאנשים שיתפו עם בני משפחתם וחבריהם סרטונים קצרים ומונפשים שנוצרו כך, ובהם קרוביהם ואבותיהם מזיזים את ראשיהם, מצמצים, מחייכים ונעים בצורה ריאליסטית כמעט לחלוטין.


#איך פועלת הדיפ נוסטלגיה?
דיפ נוסטלגיה מחזירה, אם כן, לחיים אנשים שצולמו בצילומי סטילס. זה מתחיל באיתור פני המצולמים בתמונות ואז הפקה של מחוות ותנועות מציאותיות, ממש כאילו צולמו בווידאו. ההנפשה של הפנים בתמונות הסטילס מראה אותם מחייכים, זזים וממצמצים, כאילו צולמו כך במקור.

בבסיס הטכנולוגי של יישום ה"דיפ נוסטלגיה" פועל אלגוריתם למידה עמוקה (Deep Learning), המחבר בין תווי הפנים של המצולמים לבין אוסף מחוות שצולמו בווידאו ושמורים במאגר החברה.

פיתוח וצילום אותן מחוות נעשה כשצילמו אנשי מיי הריטג' מראש שלל מקטעי וידאו של שחקנים ועובדי החברה, המזיזים את ראשיהם ופניהם באורח טבעי, ממצמצים, מחייכים ומפנים את ראשם לכיוונים שונים.

למעשה שכרה חברת MyHeritage רישיון מחברת D-ID, לטכנולוגיה שפותחה בה ומאפשרת שחזור, באמצעות טכנולוגיית למידה עמוקה, של סרטוני וידאו.

על מנת שאפקט ההנפשה יופעל על התמונות, ברזולוציה הכי גבוהה האפשרית, עוברות תמונות מטושטשות חידוד אוטומטי, שמבצעת הטכנולוגיה החדשנית, מה שמעלה באופן דרמטי את איכות הסרטונים המופקים בה.

ההברקה האמיתית של הטכנולוגיה הזו נעוצה בזיהוי והבחירה האוטומטית שמבצע יישום הדיפ נוסטלגיה, מבין מקטעי המחוות בווידאו. ניתוח מהיר של מנח הראש וכיוון העיניים של המצולמים בתמונה מאפשרים ליישום להתאים להם באופן חכם את מחוללי ההנפשה המיטביים ולייצר את הסרטונים המונפשים באופן אופטימלי.


#ממה נמנעו מפתחי הדיפ נוסטלגי?
אנשי חברת MyHeritage ומפתחי היישום המלהיב נמנעו מהוספת דיבור לסרטונים.

לאור העובדה שטכנולוגיית הדיפ פייק ידועה ביכולות המטורפות שלה, גם בתחום הדיבור, נשאלת השאלה מדוע. הרי ניתן היה לשתול בפי המצולמים טקסטים מדוברים, שהיו נשמעים אמיתיים, על אף שמעולם לא צולמו והוקלטו.

ראשית, חשוב לומר שזיהוי קולי של המצולמים, ככל שמדובר באנשים שקרוביהם זוכרים עדיין את קולם האמיתי, היה מפחית את אפקט המציאות שיוצרים הסרטונים הללו.

אבל יש עוד סיבה לכך.

ב-MyHeritage מציינת שההימנעות מאפקטים קוליים של דיבור היא מכוונת. מטרתה, הם מטעימים, היא "למנוע שימושים זדוניים בכלי", דוגמת אלה שנעשים בסרטוני "דיפ פייק" של פוליטיקאים וידוענים שעודם בחיים.

לכן הם גם מבקשים מהמשתמשים לעשות בכלי שימוש רק על תמונות היסטוריות השייכות להם ולהימנע משימוש בתמונות של אנשים חיים, שלא אישרו את השימוש הזה.


הסבר לטכנולוגיה (עברית):

https://youtu.be/O4VPN_YjgIM?t=21s


הנה הדיפ נוסטלגיה:

https://youtu.be/tjBYSnoAWqg


ציורים מפורסמים שקמים לתחייה:

https://youtu.be/TWY1uBK4Zxc


ואפילו דיקטטורים קמים לתחיה עם הדיפ נוסטלגיה של מיי הריטג':

https://youtu.be/a-HR03bToew
מחשוב קוגניטיבי
מהו המחשוב הקוגניטיבי?



יתכן ששאלתם את עצמכם פעם איך זה שהמחשבים המשוכללים והמהירים כל כך יכולים לבצע כיום משימות שלא ייאמנו, אבל לא מסוגלים לבצע דברים שאפילו תינוקות עושים בקלות.

מזיהוי אנשים ועד להבנת השפה המדוברת, דרך למידה מטעויות או הבנת ההקשר בשיחה, להסיק מסקנות ועוד, יש לא מעט דברים שבני אדם מקבלים כמובנים מאליהם ואף כפשוטים, בעוד המחשבים מתקשה בהם מאד.

בדיוק לשם כך נוצר תחום חשוב במדעי המחשב. מחשוב קוגניטיבי (cognitive computing) הוא תחום בתוכנה המדמה את החשיבה האנושית.

מדובר בתוכנות שאמורות להיות מסוגלות לבנות ולנתח ידע, לבצע תהליך ארוך ומשמעותי של למידה עצמית, להבין את המידע לעומקו, לנתח טקסטים בצורה תבונית ולתקשר עם בני אדם בדרך שמבינה מצבי רוח, הקשרים חברתיים ואישיים ועוד, בקיצור כל דבר מהמרכיבים הקטנים של השפה האנושית ועד לסתם ללמוד מהניסיון.

במחשוב הקוגניטיבי מנסים לשלב בין יכולות שונות, שחלקן בפיתוח כבר שנים רבות. למידת מכונה, כריית מידע, זיהוי עצמים ייחודיים בתמונות, עיבוד שפה טבעית או איתור של דפוסים ותבניות במידע גולמי - כל אלה ואחרות אמורות לאפשר יצירה של מחשב שיכול לחקות את הדרך בה המוח האנושי עובד ולהפיק תוצאות ברמה גבוהה במיוחד, לקבל החלטות חכמות ועוד.

אם זה מזכיר לכם תחומים כמו אינטליגנציה מלאכותית או למידת מכונה, זה לא מקרה. מדובר בתחומי מחקר קרובים ומשיקים בהרבה מובנים.

מטרת החוקרים והמהנדסים העוסקים בתחום המחשוב הקוגניטיבי להביא לכך שבעתיד יוכלו מחשבים לבצע משימות פשוטות עבור בני-אדם, כמו חשיבת מומחה והבנת השפה האנושית.

כמובן שבצד פעולות "אנושיות" אלה ישלבו המחשבים גם את יכולותיהם המסורתיות כמו עיבוד נתונים בכמויות עצומות, מה שמוכר מתחום הביג דאטה, על מנת להפוך ליועצים נבונים לאנשי מקצוע בתחומים שונים, מרפואה ועד מדע והייטק.

יישומים נוספים שמצפים לפתח בעזרת מחשבים קוגניטיביים הם מערכות תקשורת בשפה טבעית, "נהגים ממוחשבים" ברכבים אוטונומיים (מכונית ללא נהג), עיבוד סמנטי, מנועי חיפוש שלומדים ועוד.


הנה המחשוב הקוגניטיבי המודרני בחצי דקה:

https://youtu.be/1tsFTBqXDdI


מצגת וידאו שמראה מה מאפשרות מערכות מחשוב קוגניטיביות:

https://youtu.be/1mPO-rXcmaw


מומחים מחברת יבמ מסבירים על העתיד של המחשוב הקוגניטיבי:

https://youtu.be/xRamODPdU1U


עולם זיהוי העצמים הממוחשב (מתורגם):

https://youtu.be/Cgxsv1riJhI?long=yes


והאם אנו מתקרבים למחשבים עם תודעה:

https://youtu.be/JTOMNkZJRao?long=yes
רשת עצבית מלאכותית
מהן רשתות נוירונים ממוחשבות?



רשתות נוירונים (Neural Networks) הן רשתות מחשבים מתקדמות שמחקות את החשיבה האנושית.

נוירון במוח הוא תא עצב. זהו תא טיפש, ללא יכולת מרשימה בפני עצמו. את כוחו ויכולתו המדהימה לפתור בעיות מורכבות הוא קונה רק כשהוא שותף זעיר ברשת העצבית העצומה, שקוראים לה מוח.

למוח ולרשת נוירונים טכנולוגית שמחקה אותו יש את היכולת המדהימה לפתרון בעיות מורכבות. רשת נוירונים היא "רשת עצבית" מלאכותית, שמעתיקה את הפעילות של שכבות תאי העצב בניאו-קורטקס, האזור שתופס את רוב המוח האנושי.

בניאו קורטקס נעשית החשיבה שלנו. ב"רשת נוירונית" מחובר כל נוירון בסינפסות אל נוירונים נוספים. התקשורת בין הנוירונים היא באמצעות "פוטנציאלי פעולה" - מעין הבזקים, פעימות חשמליות, שעוברות בסינפסות בין נוירון, תא עצב, למשנהו והלאה אל הנוירון הבא ולאלה שאחריו.

מחקר רשתות הנוירונים עוסק בבניית מודלים וירטואליים של שכבות תאי העצב ובתחום זה עוסקים כיום צוותים מגוונים, שמורכבים ממדעני מוח, מדעני מחשב ותוכנה. רשתות מחשבים כאלה יוכלו בעתיד לבצע פעולות שהמוח יודע לבצע בקלות: לאסוף מידע, לנתחו ולהגיב לו בקבלת החלטות שאנו עושים אלפי פעמים ביום.

תחום הנוירו-מחשוב הוא אחד התחומים החשובים בעולם כיום. הוא יוביל בעתיד לדור מתקדם במיוחד של תוכנות חכמות. כבר היום רואים את האפשרויות של תוכנות-מוח שכאלה - מאפליקציות שלומדות את טעמנו האישי ומציעות לנו בגדים, אוכל, מוסיקה או ספרים שאנו אוהבים. בעתיד יותר ויותר טלפונים חכמים ילמדו הרגלים, תחביבים, העדפות וצרכים של המשתמש ויסייעו לו.

גם ברפואה משפרות רשתות עצביות את היכולות ומציעות השפעות נפלאות על היכולת לאתר סרטן עור מוקדם, לגלות טיפולים תרופתיים חדשים למחלות ועוד.

דמיינו מצלמות חכמות, שיודעות לזהות פורץ או מבקר תמים בביתנו, מערכות מחשוב שיזהו האקרים לעומת משתמשים תמימים שטעו, בידוק בטחוני שיזהה מפגים או עבריינים ומערכות צבאיות שיוודאו שכוחותינו יזהו וישמידו את כוחות האויב ולא את כוחותינו.


המלצה:
======
קראו באאוריקה בתגית "למידה עמוקה", על פיתוח מערכות הבינה המלאכותית שמתבססות על רשתות הנוירונים.


הנה רשתות הנוירונים הממוחשבות (מתורגם):

https://youtu.be/JrXazCEACVo


דרך לזהות בהן הפרעות נוירולוגיות (עברית):

https://youtu.be/Agrf1PPXSl8


רשתות הנוירונים שבמוחנו:

https://youtu.be/Gf5QEzZ9F3w


התהליך הכימי של מעבר המידע בין הנוירונים (מתורגם):

https://youtu.be/6Ra3il45vnE


כיום מפתחים רשת נוירונים שמחקה את יכולת הלמידה של תינוק:

http://youtu.be/VNNsN9IJkws


הסבר מדעי (מתורגם):

https://youtu.be/Z6xDuPOgT_Q


דרך שבה רשתות נוירוניות פועלות:

https://youtu.be/h52wgSsm57g


והפיתוח שלהם על ידי למידה מהביולוגיה והטבע:

https://youtu.be/JqMpGrM5ECo


בינה מלאכותית כללית
מהי בינה מלאכותית כללית, באנגלית AGI?



בינה מלאכותית כללית (AGI), באנגלית Artificial General Intelligence, משמעותה בפשטות היא בינת-על. בינה מלאכותית שלא יודעת לעשות רק דבר אחד, או בתחום אחד, אלא כזו שיודעת לעשות הכל.

היא נקראת גם בינה מלאכותית חזקה, בניגוד לבינה מלאכותית צרה, חלשה, המיועדת ומתוכנתת למשימות ספציפיות, הבינה הכללית המלאכותית היא סופר-אינטליגנציה, שאינה מוגבלת בתחום או במיומנות ספציפית, אלא בינה מאוד חכמה, מבריקה, גאונה.

דמיינו AGI בתור הגאון של החברה, אדם חכם ונבון מאוד, או בעצם המון כאלו. היא תהיה מצוידת בכל החושים ויכולות הקוגניציה שיש לאדם, כולל שמיעה, ראייה, הבנה של הקשרים, יכולת לפענח התנהגות, חשיבה יצירתית וכדומה.

בקיצור, ה-AGI היא מאסטר מיינד גאוני, כלי ממוחשב שיהיה כה מבריק ומתוחכם, עד שיעקוף את האדם בבינה שלו ומן הסתם את האדם הכי חכם שאתם מכירים, או את כל הכי חכמים (אולי בעולם) יחדיו.

אם בעבר היה פיתוח AGI מושג מופשט ומטרת מחקר תיאורטית, בשנת 2020 העריכו בקבוצות בינה מתקדמות שייקח עוד 50 שנה עד שתגיע בינה מלאכותית ג'נרליסטית שכזו. ההערכה כיום, באפריל 2024, היא שבין 2026 ל-2027 תהיה הבינה המלאכותית הכללית בשוק.

לא יאומן? - התרגלתם. אנחנו חיים בעתיד...

כל חברות הטכנולוגיה הגדולות נמצאות בעיצומו של המרוץ לפיתוח בינת-על שכזו. מגוגל, אפל, אמזון ומטא ועד למלכת ה-AI הנוכחית, חברת OpenAI הצעירה, זו שהשיקה את מהפכת הבינה היוצרת והיצירתית (GenAI), פיתחה את דאלי ואת. הצ'ט בוט המצליח בעולם ChatGPT ושועטת עכשיו קדימה בפיתוח הבינה המלאכותית הכללית.


#מה בינה כללית תדע לעשות?
נזכיר שבינה מלאכותית הכללית, מעבר לתחכום שלה, מסוגלת לבצע מגוון משימות רחב, לפתור בעיות לפני שנוצרו ולמלא משימות מושלמות, מבלי שיתכנתו אותה ליכולת ספציפית כלשהי. היא פשוט תלמד כל יכולת כזו שתצטרך בעצמה ותדע לבצעה כאילו כל חייה היא עשתה זאת...

כבר עכשיו ברור שמערכת AGI סופר אינטליגנטית שכזו תתאפיין בתבונה כללית ויכולת להפעיל שיקול דעת, תוך קבלת החלטות מורכבות. לצד זה יהיו לה יכולות של הבנת שפה טבעית של בני אדם, ביחד עם למידה עצמאית של מידע חדש ובכך שיפור מתמיד של יכולותיה לתחומים ומיומנויות חדשות (ללא תכנות ספציפי), ביכולות של חשיבה מופשטת ויכולת להבין וליישם מושגים מופשטים, כולל במצבים חדשים.

לא פחות חשובה היא היכולת היצירתית החשובה כל כך של העברה בין תחומים, כלומר היכולת לנייד ולהעביר בין תחומי דעת שונים ידע, מיומנויות ויכולות שונות. כך, חברים, נולדים המצאות, פתרונות לבעיות והברקות הנדסיות, מדעיות וטכנולוגיות שונות.

סופר-אינטליגנציה שכזו תקבל בעתיד החלטות ביטחוניות שיילכו וישתבחו, ככל שהיא תלך ותשכלל את עצמה. היא תיקח על עצמה את האחריות על ניהול המערכת הפיננסית, מהאישית ומשפחתית ועד לרמת אוצר המדינה או הבנק הלאומי. היא תנהל מגוון מערכות שירותים ומערכות תשתית, טוב יותר מכל אדם, תמצא תרופות למגוון סוגי הסרטן ותפתור את בעיות האקלים. לא מן הנמנע שפרסי נובל יתרחבו למפתחי בינות-על, שיפצחו בעיות שהמין האנושי לא השכיל לפתור.


#סכנות בינת העל
השאלה העיקרית והמפחידה לא מעט אנשים היא מה יקרה אם או כשבינת העל הזו תחליט שאנו, בני האדם, מיותרים בעולם... זו הסיבה שעולם הטכנולוגיה מלא באזהרות של מומחים מקוגניציית-העל שלה.

כבר עתה ברור שתהיה חובה לייצר פיקוח ורישוי (רגולציה) וחוקים שיחייבו את החברות שיפתחו AGI לקחת אחריות מלאה לנזקים שבינתם עלולה לגרום. מה יהיה שבינות חכמות כל כך יקבלו החלטות שיסכנו ואף יקטלו בני אדם, או שיעדיפו בקבלת ההחלטות שלהן שיקולים שונים מטובת בני-אדם לפני הכל.

כשבידיה של אינטליגנציה עילית שכזו תהיה היכולת לשלוט ישירות בכל המערכות הטכנולוגיות שמקיפות אותנו, לא ניתן יהיה למנוע את ההחלטות שהיא עלולה לקבל, כמו גם את הביצוע שלהן.

לכן ברור שיהיו חייבים להינקט עיצומים מרתיעים וכבדים דיים, כך שימנעו מחברות הטכנולוגיה כניסה להרפתקאות בלתי אחראיות ומסוכנות לאנושות.


הנה ההשפעה הצפויה של הבינה המלאכותית הכללית על המין האנושי (מתורגם):

https://youtu.be/RzkD_rTEBYs


מהי הבינה המלאכותית הכללית?

https://youtu.be/kHFVZV-lj8g


הסבר מפורט לגבי הבינה המלאכותית הכללית:

https://youtu.be/LhLyOWoUnDI?long=yes


האם AGI פרק את צוות החברה המובילה את ה-AI כיום?

https://youtu.be/OphjEzHF5dY?long=yes


והיום כבר מדובר על ASI שתעבור בהרבה את הבינה האנושית:

https://youtu.be/C0RjMAWhvh8?long=yes
מהו ווטסון, מחשב העל הלומד?



המודל הבינתי שנקרא "ווטסון" (Watson) הוא ככל הנראה הראשון שפותח על ידי חברת IBM, על מחשב-העל שלה. זה מודל AI קוגניטיבי, כמעט המחשב החושב שדורות של מדעני מחשב דיברו על בואו, אבל עם רגליים אי-שם בעתיד.

ווטסון נחשב עם הצגתו לציבור למחשב החכם בעולם וזכה להכרה בינלאומית. הוא החליף את "כחול עמוק". גם הוא פותח על ידי אותה חברה (Ibm) וזכה להישג היסטורי וחסר תקדים, כשניצח בעבר את אלוף העולם בשחמט.

ווטסון נקרא על שם תומאס ווטסון, מייסד IBM, אם כי לפי גרסה אחרת ווטסון קיבל את שמו מהעוזר של שרלוק הולמס, אותו עוזר שכמו מודל כזה, תמיד מסייע לו בחקר ובתשובות שונות לצרכי הבלש הנודע.

זה היה כשהיה הראשון שניצח בני אדם בשעשועון טריוויה בטלוויזיה. ווטסון השתתף אז בתוכנית הטלוויזיה הוותיקה בארה"ב, "ג'פרדי" ("מלך הטריוויה"). במהלך התכנית הוא הראה ידע עצום ושלט גם בטקטיקה של משחקי הטלוויזיה מסוג זה.

הניצחון של המחשב בנוק אאוט על פני המוח האנושי היה מהפכני בכל קנה מידה, במיוחד בזכות העובדה שווטסון לא היה מחובר לאינטרנט ולמנועי חיפוש דוגמת "גוגל", אלא רק מצויד במידע של אנציקלופדיות, מילונים, מאגרי חדשות, יצירות ספרות ושירה וכדומה.

ווטסון היווה ממש מהפכה, ביכולתו לחבר יכולות מתקדמות בחיפוש מידע מהיר ויעיל עם אינטליגנציה מלאכותית מהסוג הדרוש למכונה כזו. טכנולוגיות מתקדמות של למידה ממוחשבת (Machine Learning), עיבוד שפה טבעית (NLP), זיהוי קול אנושי (Speech Recognition) ומגוון שיטות לאיחזור מידע (שליפה מהירה ממאגרים עצומים), היקנו לו את היכולת לתפקד באופן חסר תקדים בתחום המחשוב.


הנה סרטון על מחשב-העל ווטסון ואיך יבמ יצרה אותו:

https://youtu.be/U6rvaWaiZNg


רגע היסטורי - לראשונה ווטסון מנצח בני אדם בשעשועון הידע הטלוויזיוני:

https://youtu.be/WFR3lOm_xhE


כיום הוא כלי מרכזי בניסיונות למצוא תרופה לסרטן:

https://youtu.be/HkEOJnn_zlg


כאן ווטסון לומד לבשל:

https://youtu.be/yrfMcNE0y9s


והוא פתוח לשימוש של סטארטאפים ומפתחים הזקוקים לכוח המחשוב המטורף שלו:

https://youtu.be/RBF4hhgAJJc


ומסביבו יש כנסים מרתקים גם בארץ (עברית):

https://youtu.be/M_q5z6VXRzI
מהם סרטוני דיפ פייק ומה הבעיה בהם?



דיפ פייק (Deep fake או Deepfake) הוא שמה של טכנולוגיית וידאו, מבוססת בינה מלאכותית (AI), המאפשרת לייצר מציאות שנראית אמיתית ומבוססת על אנשים אמיתיים, אך לא התרחשה מעולם.

זה נעשה על ידי לקיחת תמונות, סרטונים וקולות ושינוי שלהם באמצעות AI, באופן שמאפשר לייצר תכנים דומים, הנראים אמיתיים, אך מעולם לא קרו, התרחשו או נאמרו באמת.

טכנולוגיה זו הולכת ותופסת בשנים האחרונות את מקומה ברשתות החברתיות שבאינטרנט.

העיקרון המוביל בסרטוני ה-Deepfakes הוא שחזורי פנים מדויקים, המולבשים על סרטוני וידאו, תמונות או אנימציה ומייצרים מראות הנראים אמיתיים לגמרי.

בסרטונים, למשל, מדובר על החלפת פניו של מי שצולם בווידאו, באמצעות למידת מכונה. התוצאה של זה היא יצירה בקלות של סרטוני וידאו המציגים אנשים העושים מעשים שמעולם לא עשו באמת או אומרים דברים שלא נאמרו.


#תולדות ה"דיפ פייק"
את לידת הטכנולוגיה הזו סימנה אפליקציה בשם FakeApp, שפותחה בסין על ידי מיזם בשם MoMo. המיזם היה ככל הנראה החלוץ בכך שאפשר להמונים להדביק את פניהם לזמרים, שחקנים ודמויות ממשחקי וידאו. לראשונה ראו המשתמשים שמספיקה תמונה אחת של פניהם, כדי שהאפליקציה תדביק ותמפה אותה באופן אוטומטי על גבי הקליפים שהיא מציעה.

בשנת 2016 כבר פותחו מערכות למידת מכונה אוטומטיות וחזקות יחסית, כאלה שלומדות ומשתפרות בעצמן, ככל שהן מופעלות. המערכות הללו חזרו שוב ושוב על תהליכי יצירת Deepfake וככל שהתהליך נמשך, לאחר מיליוני פעמים, הן שיפרו את התוצר. בשנה זו יצאו כבר תוכנות שאפשרו זאת גם על מחשבי PC ביתיים וחלשים יחסית.

את שמה קיבלה הטכנולוגיה הזו בשנת 2017, ממשתמש באתר Reddit שכינויו "זיופים עמוקים". הוא טבע את המונח לאחר שערך כמה סרטונים פורנוגרפיים ובהם הוא הטמיע, באמצעות טכנולוגיית "למידה עמוקה" (Deep learning), את פניהם של ידוענים ומפורסמים שונים.

את פרסומה העיקרי חייבת הטכנולוגיה הזו לסרטוני "פייק ניוז", חדשות כזב, שיצרו תומכי פוליטיקאים בארצות הברית, במהלך קמפיין הבחירות לנשיאות 2020. לפתע החלו להופיע סרטונים בהם ממליצים ומסבירים נשיאי עבר ומשפיענים פוליטיים שונים על דברים בדויים ומנוגדים לאמת. על התחום הזה שווה לקרוא בתגית "פייק ניוז".


#למה משמשים סרטונים אלו?
טכנולוגיית ה-Deepfake משמשת ליצירת תוכן וידאו המציג מציאות בדויה לחלוטין, דברים שנראים ונשמעים אמיתיים ומצולמים, אך למעשה לא התרחשו מעולם.

ביטויי הסרטונים הללו, שזכו לכינוי Deepfakes, הם רבים. הם מתחילים מפוליטיקה בה מיוצרים כך נאומים שלא ננאמו ומעבירים מסרים בדויים מפיהם של ידוענים, מנהיגים ומפורסמים ומסתיימים כיום בסרטונים "פסאודו-תיעודיים", המציגים מעשים, מראות וטקסטים מדוברים, הנראים אמיתיים לחלוטין אך מעולם לא צולמו והוקלטו.

מדובר בעניין מהפכני. מעולם לא עמדה טכנולוגיה כה חזקה וריאליסטית לטובת תעשיית השקר, או בשמה המכובס, תעשיית ה"פוסט אמת".

בעולם של ה-Deepfakes השתפרו האפשרויות ליצירה והפצה של שקרים פראיים. הן כה מרשימות, עד כדי כך שמיליונים "נופלים בפח", מאמינים לסרטוני הדיפ פייק הללו ומשנים בגללם את דעותיהם ואף את התנהגותם והעדפותיהם הפוליטיות. ראו את סרטון הטבע שאנו מציגים למטה ובו בעלי חיים בדויים וכמה שהוא נראה אמיתי.


#סיכום
הכלים ליצירת סרטוני ה"דיפ פייקס" הם כלים טכנולוגיים, מתוחכמים מכל טכנולוגיה שעמדה בעבר לטובת השקרנים ומקדמי מה שזכה לכינויים כמו "אמת אלטרנטיבית", תיאוריות קונספירציה וכדומה.

מעולם לא עמדו טכנולוגיות כה חזקות לרשות השקרים הקטנים, להם מתאפשר עתה להמציא ולהפיק את הבדיות שלהם באופן מוחשי וריאליסטי מאי-פעם.

מצד שני, מעולם הדיפ פייק נולד עם הזמן גם יישום ה"דיפ נוסטלגיה". עד שימצאו גם לו שימושים מזיקים ואף מחרידים, זהו עולם חיובי, סנטימנטלי ומעורר התרגשות אמיתי, בהנחה שנוסטלגיה אינה מזיקה לאיש. ניתן לקרוא עליו בתגית "דיפ נוסטלגיה".


הסבר לטכנולוגיה (עברית):

https://youtu.be/lk-1hBpAyiU


אובמה מדבר פייק:

https://youtu.be/gLoI9hAX9dw


סרט טבע פיקטיבי שיצרו בעזרת Sora ומציג פייק חיות:

https://youtu.be/ObUBUKOn-bo


ההשלכות של זה מטורפות (עברית):

https://youtu.be/4BsiYnt51ok


כך יוצרים פנים ממאפיינים או שילובי פנים אמיתיים:

https://youtu.be/kSLJriaOumA


שעשוע עם טראמפ ומיסטר בין:

https://youtu.be/HN-qlGf2mZw


וקצת מוסיקה מצמד הנשיאים וחתול:

https://youtu.be/dsODRfCMRoM
אילו מקצועות ייפגעו מהבינה המלאכותית הגנרטיבית?



אנו בעידן הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer. הצ'ט בוט הזה מוביל שורה של פיתוחים דומים ולמעשה הוליד, כמעט יש מאין, עולם חדש של טכנולוגיות. יצירתיות, חדשניות ומדהימות.

העניין הזה כבר הוליד פועל חדש בעברית, כשהמערכות הללו מתחילות לג'נרט (מלשון generate), כלומר לייצר תוכן באופן אוטומטי על ידי מחשבים ומודלי שפה תבוניים, דוגמת ChatGPT, Claude, Gemini ודומיהם.

מודלי השפה הללו מתקדמים במהירות והמירוץ לפתחם ימשיך. במקביל לעבודה המדהימה שעושים המפתחים של O.AI יוצאים כל הזמן כלים מתחרים, כולל של ענקיות כמו גוגל, פייסבוק ואמזון, העובדות על מוצרים דומים.

ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.

אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך עליו ועל הידע והמידע שהיא מציע לנו בכל התחומים, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות. בעניינים אחרים המרוץ לבשלות ככל הנראה ימשיך והם יגיעו די מהר...

קשה אולי להאמין שהמקצועות שאנו מכירים ייעלמו לגמרי. וגם אלו שאכן ייעלמו - זה לא יקרה מיד, אבל זה תהליך שיימשך, תהליך בו מקצועות עבודה יהפכו יותר ויותר למקצועות של פיקוח על הבינה המלאכותית שעושה אותה.

כשהאדם מפקח על עבודת המכונה, הוא יצטרך להיות בתחום כדי להיכנס לפעולה כשהמכונה נתקלת בבעיה שהיא לא יודעת לפתור, לא מתפקדת, מתקלקלת וכדומה.

אז אילו סוגי מקצועות ייפגעו מהבינה? - ההערכה היא שבעיקר מדובר בעבודות הקשורות בשפה. כל מי שמשתמשים בעבודה שלהם בשפה, באופן ישיר ומשמעותי ולא הכרח ביכולות אחרות, פיזיות, ליטרלי שריריות, יכולים לשער שהבינה המלאכותית תוכל לבצע במעלה ההתפתחות שלה את מלאכתם.

עיתונאים, מידענים, תחקירנים, אנשי שיווק, פרסום ויוצרי תוכן, מתכנתים ואפילו מוסיקאים - אצל כולם השפה היא כלי מרכזי בו הם עושים שימוש בליבת שיטת העבודה. אז זה לא שלא יהיו עיתונאי-על, או מוסיקאים אנושיים - הם פשוט יהיו מעטים ומעולים. השאר ימצאו את עצמם מוקפים באנשים שאינם אנשי מקצוע, אך למדו לנצל כלי AI ולייצר תוצרים שייתחרו בשלהם.

גם אנשי מדיה צריכים לדעת שהמקצועות שלהם יעברו שינויים משמעותיים ולמעשה כבר עוברים. עורכי סרטים, צלמים, יוצרי סרטים, מקליטים, עובדי אולפנים, טכנאי סאונד, עורכי אפקטים ומעצבים גרפיים - המקצועות הללו כבר עוברים שינויים וכדאי שיתעדכנו בהם היטב כי כך יוכלו להשתנות עם התחום ולהתבגר לחידושי ה-AI שייכנסו אליו, למצוינות והובלה בו.


הנה השפעת הבינה המלאכותית על העולם האנושי שלנו (מתורגם):

https://youtu.be/RzkD_rTEBYs


יחליף את המורים? - למה בחינוך מודאגים ממודל השפה החדש?

https://youtu.be/Fn8jDanbf0c


האם הג'י פי טי יחליף למשל את הסופרים ויכתוב ספרים, כמו שהוא מייצר היום ספרי ילדים (עברית):

https://youtu.be/sDjFRAP0Szg


ומה הוא עושה לתלמידים והמורים (עברית):

https://youtu.be/vmmUiyeGNB8?long=yes
מה היה החורף של הבינה המלאכותית?



החורף של הבינה המלאכותית (The winter of artificial intelligence), או "חורף ה-AI", הוא מונח המתאר תקופה משמעותית בהיסטוריה של מדעי המחשב והטכנולוגיה. תקופה זו, שהתרחשה בעיקר בשנות ה-70 של המאה ה-20, סימנה נקודת מפנה בהתפתחות הבינה המלאכותית ובתפיסה הציבורית שלה.

בתחילת דרכה, בשנות ה-50 וה-60, הבינה המלאכותית הייתה מושא להתלהבות ואופטימיות רבה. חוקרים ומדענים הצליחו לפתח מערכות שיכלו לבצע משימות בסיסיות כמו משחק שחמט ופתרון בעיות מתמטיות פשוטות. ההישגים הללו יצרו ציפיות גבוהות לגבי העתיד, והאמונה הרווחת הייתה שבקרוב נראה מכונות חושבות ברמה אנושית.

אולם, עם כניסת שנות ה-70, החלה להתפשט תחושת פיכחון. התברר כי המערכות שפותחו היו מוגבלות מאוד ביכולותיהן, המחשבים לא ענו על הציפיות הגבוהות שתלו בהם ודרשו תכנות מורכב ומפורט, אפילו לביצוע של מטלות פשוטות יחסית. גם מדענים מצאו את עצמם מתקשים ללמד מחשבים דברים בסיסיים שתינוק יודע לעשות, כמו להבין משפטים על פי ההקשר שלהם ושפה בכלל. הטרידו גם העלויות הגבוהות במיוחד שהיו כרוכות בפיתוח והתחושה בתחום הייתה שהתוצאות לא עומדות בציפיות הגבוהות שנוצרו בעשורים הקודמים.

כתוצאה מכך, ההתלהבות והאופוריה סביב הבינה המלאכותית דעכו. המימון למחקר ופיתוח בתחום הצטמצם באופן דרמטי, וחלק מהחוקרים המובילים עברו לתחומים אחרים. תקופה זו סימנה האטה משמעותית בהתקדמות התחום, והובילה לספקנות רבה לגבי היכולת להגשים את החזון של מכונות חושבות.

חוקרים שונים מגדירים אחרת את אורך התקופה. יש הטוענים שהתקוות המנופצות בחורף של הבינה המלאכותית נמשך עד שנות ה-80, כשתחום ה-AI מתחיל לחוות פריחה מחודשת ואיטית, כשבין השאר שווקו לראשונה מכונות ה-LISP, מכונות הבינה המלאכותית הראשונות. אחרים טוענים שהאביב של הבינה המלאכותית מגיע רק באמצע שנות ה-2000. אין ויכוח שהשינוי הונע, בין השאר, מפיתוח "מערכות המומחה", מערכות ממוחשבות שנועדו לחקות את יכולות קבלת ההחלטות של מומחה אנושי בתחומים ספציפיים. התפתחויות אלו סימנו את תחילתו של "האביב" החדש בבינה מלאכותית.

וכך, בתוך עשור מאז 2005, השתנו מקצה לקצה התפיסה לגבי הבינה המלאכותית והתחזיות לגביה. מי שהובילו לכך היו קבוצות שונות של חוקרים, שניסו בהתמדה לפתח "מוח ממוחשב". הגישה התבססה על הרעיון שהמוח האנושי הוא אוסף רכיבים, המחוברים ביניהם כשלכל אחד מהם תפקיד עצמאי משלו. השינוי שהובילו אותן קבוצות, בהשראת מדעי המוח, היה "הלמידה העמוקה", גישה לבניית מכונות תבוניות, ברעיון שהחל להבשיל ולהתפתח יותר ויותר.

את התוצרים של השינוי המאסיבי הזה אנחנו רואים היום, בעידן הבינה המלאכותית הגנרטיבית, המכונות הלומדות ואינסוף הפיתוחים שמתפוצצים מול עינינו ומושתתים על Deep Learning, אותה "למידה עמוקה", שבה המחשב לומד ומלמד, למעשה, את עצמו.

השפעתו של חורף הבינה המלאכותית חרגה מעבר לתחום המדעי והטכנולוגי. הוא השפיע באופן עמוק על התפיסה הציבורית של התחום, וסימן מעבר מאופטימיות מופרזת לגישה מפוכחת יותר לגבי האפשרויות והמגבלות של טכנולוגיה זו. תקופה זו עיצבה את הדרך שבה אנו מתייחסים לבינה מלאכותית עד היום, ומזכירה לנו את החשיבות של שמירה על ציפיות ריאליסטיות לצד המשך החדשנות והפיתוח הטכנולוגי.

למרות שהחורף של הבינה המלאכותית נתפס בזמנו כתקופה של נסיגה, בראייה לאחור ניתן לראות בו שלב הכרחי בהתפתחות התחום. הוא אילץ את החוקרים לבחון מחדש את הנחות היסוד שלהם ולפתח גישות חדשות ומציאותיות יותר, שבסופו של דבר הובילו להתקדמויות המשמעותיות שאנו עדים להן כיום בעולם הבינה המלאכותית.


הנה סיפור החורף של הבינה המלאכותית:

https://youtu.be/w_v5lumtoPk


כך משתלב חורף הבינה המלאכותית בתולדות ה-AI כשלב קשה ומשתק:

https://youtu.be/yaL5ZMvRRqE



וכך קידמה למידת המכונה את הבינה המלאכותית לשלב הבא (מתורגם):

https://youtu.be/f_uwKZIAeM0
האם בינה גנרטיבית תפגע בנו בעתיד ותיקח לנו את העבודה? ואיך להימנע?



בפשטות כן. אולי לא בכולנו ולא בכל אנשי המקצוע אבל הבינה המלאכותית תוכל לגרום לקשיים עבור רבים - בעבודה ובעולם התעסוקה. באופן מסוים, היא עלולה להביא את העולם אפילו למשבר כלכלי של ממש.

אלא אם... חכו עוד מעט.

בשלהי שנת 2022 כל העולם דיבר לפתע על הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer.

מודל השפה שעליו התבססו המפתחים בחברת Open AI נקרא GPT-3, אבל גרסה 4 ואלו שאחריה לא יאחרו והמירוץ לפתח אותו ומודלים רבים אחרים יימשך. כי במקביל לעבודה המדהימה שעושים מפתחי Open AI פותחו די מהר כלים מתחרים.

ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.

אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך בעיניים עצומות על הידע והמידע שהם מציעים לנו, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות.


#אז הלך עלינו?
הבינה המלאכותית שמפגינים ChatGPT ושאר כלי ה-GPT יכולה לעשות בהצטיינות עבודות של איסוף ומיון של מידע או ידע (שני דברים שונים) ואחרי זה גם כתיבה ויצירה.

כי ה-AI ברמה הגבוהה הזו יודעת לחקות אמנות, לצייר, לתקן תמונות, למצוא תשובות לשאלות, להכין שיעורי בית, להמציא מתכונים, לכתוב עבודה לבית הספר, לחבר מוסיקה, לערוך וידאו, לכתוב קוד ולתכנת, לחבר טקסטים, לנסח מכתבים ומאמרים ועוד.

אבל היא יודעת בעיקר ליצור דברים דומים למה שכבר נעשה. אמנם ברמה גבוהה, אפילו מאוד, אבל על סמך חשיבה מקצועית וסטנדרטית של אנשי מקצוע בתחומים השונים.


#מה היא לא?
בתחום היצירה הבינה המלאכותית לא תשתווה לאנשים יצירתיים, מקוריים, שיסטו ממה שכולם יודעים לעשות ויחוללו את הפלאים שלהם. היא תדע לעשות טוב יותר ומהר יותר את מה שאנשי מקצוע טובים עושים, אבל היא תתקשה לצאת מהטוב אל המצוין, הגאוני, המבריק.

לכן היא לא תפגע באנשי מקצוע מעולים ומקוריים, בבני אדם יצירתיים, עם חשיבה מיוחדת ולא שבלונית, עם יכולת המצאה.


#אז מה ההזדמנות?
וזו רבותי ההזדמנות שלכם. משתלם היום לפתח את היצירתיות והחשיבה המקורית, ללכת על להיות קצת יותר אמן ממידען, להיות מעט פחות מהנדס "רגיל" ויותר ממציא ומי שמוצא פתרונות, כולל באינטרנט אבל לא רק - כי פתרונות לתחום אחד כבר מיושמים לא פעם בתחום אחר.

נמשיך? - להיות יותר סופר מאשר עיתונאי, יותר מלחין מאשר רק נגן ויותר מעצב מאשר גרפיקאי ביצועיסט.


#יכולות?
לשם כך דרושות יכולות מגוונות שמערכת החינוך והעולם המקצועי לא מפתחים יותר מדי. יצירתיות, ידע כללי, סקרנות וחוצפה הם חלק מהיכולות הללו.

יצירתיות - הציצו אצלנו בתגית "יצירתיות" והבינו את הצד הזה ואיך לפתח אותו. התחלה מעולה לרכישת ידע כללי תהיה באאוריקה, בהאזנה לפודקסטים, צפייה בסרטי דוקו וסרטונים של ידע ביוטיוב ועיון בבלוגים של ידע, באזור המסקרן והלא משעמם של האינטרנט ובתנאי שהוא מתויג ולא חד-ממדי.

סקרנות - גם היא תכונה שנולדתם איתה וכדאי לשמר, במיוחד כשמסביבכם יעשה כמעט כל גוף חינוכי ניסיון להשבית אותה, לטובת חיפוש תשובות סטנדרטיות ושתהיו ותנהגו "כמו כולם". כל דבר שתלמדו לבד ותחקרו אין ספק שתזכרו טוב יותר ויום אחד עשוי לשרת אתכם, לעומת שיעורי בית שכמעט אף פעם לא.

היזהרו מתופעה שבעולם החינוך מוכרת כ"Yessing". חיפוש חשובות שהמורה יאהב, תשובות לשאלות שניתן למצוא בקלות ואפילו בלי חשיבה. אז מה הטעם בהן? לא עדיף שישאלו אותנו בבית הספר מעט פחות שאלות, אבל כאלה שיעודדו אותנו להשתמש בשתי האונות או בכל אזורי המוח? חקרו כאן את תגית "סקרנות".

חוצפה - על זה לא צריך להרחיב אבל נדגיש שמדובר בחוצפה מקצועית ולא התנהגותית. להעז. לא לומר לעצמכם שאינכם יודעים מספיק כדי לפתח או להמציא, לחבר או לצייר. פשוט ללכת על זה, לחקור איך, לאסוף דרכים, לחפש שיטות וטכניקות לאמנות וליצירה ביד.

נסו להמציא שיטות חדשות לעשות דברים וחקרו אותן, לנסות לעבוד איתן. חפשו ידע ושאלו באינטרנט עד שתקבלו תשובות. כתבו דברים כי לא פעם רק כשכותבים מבינים. זה בסדר לגנוב ולהעתיק ואז לפרק, ללמוד, להרכיב מחדש, לעבד ולהבין כיצד לשלוט במיומנויות הכרחיות. אם אין זמן אז קומו שעתיים קודם או לכו לישון מאוחר, גם אם תהיו קצת עייפים בבית ספר. גם ככה, אתם יודעים...

כישלונות - עוד דבר שיעזור ויהיה הכרחי הוא היכולת שלא להיבהל מכשלון ואפילו ללמוד לחבק אותו. חינכו אותנו שההצלחה היא המטרה, בעוד שמה שמתקשר אצל רובנו עם כישלון הוא כמעט תמיד אכזבה ופנים נפולות. אז כדאי שתדעו שכישלונות הם חלק בלתי נפרד מההצלחה.

היכולת שלא להרפות וליפול ברוח מהכשלון היא שמבדילה בין בני אדם. היא שמביאה נשים ואנשים בסופו של דבר להצלחה. אדיסון, מגדולי הממציאים, אמר על זה פעם שההמצאות הגדולות שלו היו כולן כשהוא לא הצליח להיכשל...

כדאי להאמין לו. אמר את זה אדם שחתום על מאות פטנטים והמצאות ששינו את העולם. בשום מקום לא נכתב כמה פעמים הוא נכשל בכל תהליך, עד שהוא הצליח בו. תמיד מספרים רק על ההצלחות אז אנחנו לא יודעים על הקשיים והנפילות, על התסכול וההפסדים.

אבל עכשיו אתם יודעים. לכן אם אומרים לך שזה גרוע? -המשיכי. צעקו לך בוז? - המשך. כמעט כל מצליחן ופורץ דרך שמע את זה בהתחלה. על בוב דילן אמרו שיש לו קול של צפרדע, המטוסים של האחים רייט צללו בזה אחר זה, הבכורה של האופרה הכי פופולרית בהיסטוריה "כרמן" הסתיימה בקריאות בוז וירקות שהושלכו על הבמה. את הסרט "בלייד ראנר" קטלו כשהוא עלה לאקרנים ואת סוקרטס הוציאו להורג על השחתת הנוער...

אז אמרו... מה הם יודעים? מי מהמבקרים והפוסלים את היזמת שאת הצליח לפני זה?

לא להרפות! אין הבטחות, אבל עקביות חשובה לא פחות מחשיבה, יצירתיות, סקרנות ומקוריות. בלעדיה כמעט ואין סיכוי להגיע למימוש כי לא מגיעים בכלל.


#אתם הורים?
אם אתם מגדלים היום את ילדיכם יש לכם אחריות ואפשרויות. תנו להם כלים, יכולות, הרימו ותפתחו את הכשרונות המלבלבים שלהם. אל תכבו אותם עם הרגיל ועם מה שאתם למדתם או רציתם להיות. בעולם שלהם אתם תהיו מבוגרים מדי או, וסליחה שאנחנו מזכירים, אולי כבר לא תהיו.

תנו להם לחקור מה ירצו לעשות. חישפו אותם לתחומים, לעולמות ולתופעות. תנו להם דוגמה אישית, קראו ספרים, אל תעשנו, אל תהיו בטטות - צאו לעשות ספורט ואם כבר אז גם אכלו נכון. צאו איתם לטבע, לטיול או הליכה, הביטו יחד בפרחים, נסו לזהות אותם ולחקור עליהם.

קראו ספר בעצמכם והביאו את הספריה של הבית לסלון, אל מול עיניהם. כבו מדי פעם את הטלוויזיה ונהלו שיחות ביניכם אל מול עיניהם ואיתם. שתפו אותם, שאלו על מה מעניין אותם ומה ירצו להיות, מה החלומות שלהם, איפה הם רואים את עצמם בגיל 25.

התעניינו בהם באמת. מה מסקרן אותם. מה מרגש ומלהיב בשבילם. התעניינו איזה חוג הכי מעניין אותם ואם אין מספיק כסף בקשו בשקט הנחה כדי שלא לבייש אותם.

נסו להשיג להם דברים שיאפשרו להם לפתח את תחומי העניין, לקנות יד שנייה, לחנך אותם שחדש זה ממש סתם ואם ראו משהו זרוק שלא יתביישו לקחת, לפרק ולהרכיב ממנו חללית. צפו איתם בתכניות מדע או בסרטי דוקו, הראו להם סרטים קלאסיים, למדו אותם ששחור לבן הוא לא פחות צבעוני ושמינימליזם הוא לא פעם הכי עשיר שיש (Less is more).

אה, ובגיל צעיר ספרו להם סיפור לפני השינה. זה כל כך חשוב שאתם לא מעלים על הדעת. הרבה יותר מ-GPT, מציור בינתי וממדעי המחשב באוניברסיטה. היו הורים, לא רק אנשי קריירה.


הנה ChatGPT ולמה בחינוך מודאגים ממנו:

https://youtu.be/Fn8jDanbf0c


בעלי מקצוע מפחדים על העבודה שלהם (עברית):

https://youtu.be/0AGYOv0sGHg


תראו למשל איך הוא מייצר קליפים (עברית):

https://youtu.be/8CmXtj5gW2I


במבט לעתיד, השינוי שה-AI ייצר הוא אדיר ותלוי גם בנו (מתורגם):

https://youtu.be/RzkD_rTEBYs


איך הצ'אט GPT בניתוח קוד? (עברית)

https://youtu.be/Z46pqHFuKHs


בחיוך - מה הכלי היחידי שיש לנו כבני אדם כדי לזהות אם הכותב או הדובר הוא בוט כמו ChatGPT? (עברית)

https://youtu.be/nes_xZjZweY


מה קורה כששואלים את הבינה של גוגל על זה (עברית):

https://youtu.be/oh4Bq8ifgK4?long=yes


וזה יקרה בשלבים ולא מיד:

https://youtu.be/iNKFOCki42I?long=yes
מה עושה הפרומפט בעולם הבינה המלאכותית הגנרטיבית?



מהו המקביל של מברשת של הצייר, מקלדת המלחין או הבוס של כותב המאמר, עורך הווידאו או המשורר בעולם הבינה המלאכותית הגנרטיבית? - מיהו זה שאומר מה הוא צריך והם יושבים לעבוד וליצור?

זהו הפרומפט (Prompt), ההנחייה הטקסטואלית שאנחנו נותנים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו תוצר בינתי.

בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצר שרוצים לקבל מהבינה.

היום הפרומפט הוא המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.

זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.


#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.

יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.


#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:

פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:

ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח. אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, הציבו גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".

שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה. זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.

בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').

הסבר כמו למתחיל - בקשו בפרומפט כך:

"Explain [subject] in simple terms. Explain to me as if I'm a beginner."


כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):

https://youtu.be/joJVqKTPVsY


השיעור הראשון בניסוח הפרומפט:

https://youtu.be/Qos2rG3zVAM


איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):

https://youtu.be/zFS7WtovYmo


יש תוכנה לעזרה בניסוח פרומפטים (עברית):

https://youtu.be/HLhRFaXQ0vQ


על הפרומפט שמייצר חדשות קוליות לגיק:

https://youtu.be/5TlsXXTamBs


מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:

https://youtu.be/pZsJbYIFCCw


הנה מקצוע מהנדס הפרומפט:

https://youtu.be/Bq-ncjOGeVU


והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:

https://youtu.be/hd7l9F3n4ZM?long=yes
מהם מנועי ציור ויזואליים כמו Dall-e ומידג'רני?



הבינה המלאכותית (AI) DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.

הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצר AI, לצייר, צלם ועוד כל מיני אמנים - אבל באינטליגנציה מלאכותית.

באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימיבייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ולא פעם אף מדהימים.

ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.

להישג המקורי של DALL-E וגרסתה המשופרת DALL-E 2, תוצר של חברת OpenAI, קמו די מהר מתחרים ראויים נוספים ואיכותיים לא פחות, המייצרים עולם חדש וחסר תקדים של ציירים מכניים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.

איש לא יודע בדיוק כיצד DALL-E פועל, גם לא היוצרים של המודלים שלפיהם הוא פועל. אבל זו העבודה המדהימה של הלמידה העמוקה שמעבדת בעצמה את הדאטה ממיליוני התמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.

התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית וחוץ מתחרות של חברות וקוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין.


הנה כלי Gen AI מצטיין ליצירה ויזואלית Ideogram.ai:

https://youtu.be/XZjaHJP0PQE


"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:

https://youtu.be/qTgPSKKjfVg


כתבה על היכולת המופלאה של דאלי 2 ליצור אמנות:

https://youtu.be/hiSgpZUAy2c


הסבר אמנות ה-AI:

https://youtu.be/alJdw4JDJ4o


מנועי יצירת תמונות מתחרים ומקבילים ל-DALL-E:

https://youtu.be/rGbNJrywLhk


גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):

https://youtu.be/KR29znIp2LU


ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:

https://youtu.be/G-Wsh1vUeVQ


מדריך להרחבת תמונות:

https://youtu.be/V1KLG159A2s


קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:

https://youtu.be/VR3AWdyVVdU


למה יש לבינה כל הזמן בעיה עם אצבעות?

https://youtu.be/24yjRbBah3w


גם למחוללי בינה כמו מידג'רני יש בעיות (עברית):

https://youtu.be/xUpUhHsAWlg?long=yes


ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:

https://youtu.be/FRClNMC_z-s?long=yes
מהי טפשת ה-AI שתפגע באיכות התוכן והקוד?



אחת התופעות שמתחילות להתגלות בשנים האחרונות, מאז הפריצה של הבינה המלאכותית הגנרטיבית, היא של טפשת שגורמת הבינה הגנרטיבית למידע ולתוכן באינטרנט.

ברור שהשימוש הכל כך קל ב-Generative AI מקל על המשתמשים, אבל ידוע לכל שיש לבדוק את המידע שהיא יוצרת לפני שמחזירים אותו לציבור כמידע שיצרו בני אדם. מסתבר שרבים לא מבינים את החולשות והפגמים שעדיין מלאים בהם מודלי השפה, אותם מודלים גדולים (LLMs) שעושים היום את הידע. אם אלה תכנים שהתקבלו מקלוד או ChatGPT, רכיבי AI שנועדו לייצר קוד בתכנות, וידאו או תמונות גנרטיביות שיוצרים מנועים שונים ועוד.

התופעה הזו כבר פוגעת באיכות המידע באינטרנט, לפי בדיקות אובייקטיביות שעורכים באופן תקופתי לאיכות הרשת. מסתבר שלא זו בלבד שבני אדם מסתמכים על מידע שחלקו לא מדויק בלשון המעטה, אלא שהקרולרים עצמם, אותן תוכנות שאוספות את המידע מהרשת לצורך אימון, הזנת ועדכון מודלי השפה הגדולים - מסתבר שהם עצמם מסתמכים על המידע הגרוע הזה. ובדיוק כך, הוא חוזר למודל השפה ונכנס לתוכן שמקוטלג לטוקנים (Tokens) ובחזרה לדאטה שעליו הם מסתמכים. התוצאה היא שיותר ויותר מידע לא בדוק ולא אחראי, שהגיע מלכתחילה לרשת ממודלי שפה לא בשלים מספיק, חוזר ומפרה את המודלים הבוגרים, שאמורים לקבל מידע אנושי ואיכותי ולא תמיד יודעים לאתר את השגיאות שבו.

גם בעולם העסקים והארגונים יש כבר החמרה. הירידה באיכות התוכן שבאינטרנט נובעת מהשימוש הגובר והולך בחומר בינוני, שהגיע מהבינה המלאכותית הגנרטיבית, אך לא בוגרת, של הדור הראשון. כבר עם ההשקה של ChatGPT ב-2022, גילו מנהלים את הצ'טבוט שמאפשר להם ליצור חומרים באמצעות בינה מלאכותית יוצרת (generative AI) וחיפשו דרכים להשתמש בהם, במקום בעבודה של עובדים או חברות מיקור החוץ שבהם השתמשו בעבר. מעט מאותם מאמצים התגלו כיעילים ומרביתם נשארו בפוטנציאל יותר מאשר החליפו עובדים.

אך בתחום התכנות זה כן קרה. מסתבר שמודלים כמו CoPilot, Claude ואחרים מייצרים קוד במהירות ומחליפים את הג'וניורים, המתכנתים הצעירים בתעשייה. לפי סקרים שמתפרסמים בעולם נראה שקצב האימוץ של המנועים הללו הוא גבוה, במיוחד ביחס לזמן הקצר שבו הם פועלים. אלא שבסוף 2024 מתחיל להסתבר שכ-40% מהמתכנתים בעולם משתמשים בכלים כאלה ומשגרים קוד שלפחות בחלקו הוא פחות מוצלח. קוד זה חוזר ו"נלמד" על ידי המודלים ומוריד את איכות התכנות שלהם באופן מתמשך, שעלול אף להחמיר.


למה מחשבים לא חכמים או נבונים כמו בני אדם?



מחשבים יודעים לעשות המון דברים מצוין, אפילו יותר מבני אדם. אבל זה לא אומר שהם נבונים או חכמים מבני אדם. עדיין...

מהירות הפעולה של המחשבים מאפשרת להם לבצע חישובים מסובכים ביותר, בשבריר מהמהירות שאפילו הגאון האנושי הכי גדול יכול רק לקנא בה. הם יכולים לחשב מתמטיקה ולבצע פעולות על תמונות, וידאו, תקשורת ועוד, אפילו לנצח את רובנו בשחמט... מחשב כבר ניצח את האלופים האנושיים, אפילו בשעשועון טלוויזיה שהתנהל בשפה טבעית, שהיא שפה אנושית.

אבל האם זה אומר שהם נבונים או חכמים באמת? ואם לא, האם בעתיד יוכל המחשב להיות חכם כמו ואפילו יותר מבני אדם? ונבון?

כרגע מחשבים הם ממש לא נבונים כבני אנוש. הם מחשבים מצוין, אבל חושבים ברמה של ילד קטן. החשיבה האנושית היא מפותחת כל כך, שהם אפילו לא קרובים לחיקוי שלה.

בקשר לחוכמה, הם לומדים ועושים זאת לא רע, אפילו טוב. למידת מכונה, למשל, מחייבת עדיין בני אדם מקצועיים שיאמנו את המחשב וזו עדיין מלאכה למומחים. זה אומר שמדובר במשהו כמו מורים ברמת פרופסור המלמדים תלמידים בבית הספר היסודי.

אבל למידה עמוקה היא סיפור אחר. כבר היום מחשבים מלמדים את עצמם, באמצעות טיפול בכמויות אדירות של נתונים, מה שקרוי לעתים "ביג דאטה", לזהות ולהסיק מסקנות שמעט מאוד בני אדם יכולים היו להגיע אליהם. זו כבר סוג של תבונה ולא סתם זהו חלק מובחר בעולם של ה"בינה המלאכותית" של ימינו.

ישנם מדענים שמאמינים שבקרוב, ממש בתוך כמה עשרות שנים, יהיו כבר מחשבים נבונים ובעלי רגשות כמו של בני אדם. זה ייצור עולם חדש ומשונה שבו מחשבים יוכלו לבצע ולחשוב בשבילנו. יש אפילו מי שטוענים שזה יאריך את חיינו בהמון שנים. האם זה טוב או שיש בזה גם רע? - כנראה שגם וגם, אבל בכל מקרה זה מעניין וראוי למחשבה!


הנה סרטון על חוכמת המחשב לעומת חוכמת האדם (עברית):

http://youtu.be/YTNasDfDE6U


אולי המחשב כן יכול להיות חכם כמו בן אדם? (מתורגם):

https://youtu.be/3wLqsRLvV-c
כיצד ניתן לחזות את מזג האוויר?



תחזית מזג אוויר (Weather Forecast) היא רעיון ישן שבמשך אלפי שנים היה חלום בלתי מושג, שאיש לא הצליח לפצח. אבל כבר בסוף המאה ה-19 הגיעה הטכנולוגיה לרמה ראשונית של הבשלה. ראשונית, כי התחזית הייתה לא מדויקת וגם במקרה בו הצליחה, טווח התחזית היה של יום יומיים מקסימום ולא יותר.

המחשב שינה הכל. כבר משנות ה-60 הלך והחליף החיזוי מבוסס המחשב את כל שיטות החיזוי של פעם. עם התפתחות המחשוב ותפוצת המחשבים האישיים, החלו המטאורולוגים לבצע פעולות חישוב שאפשרו להם להריץ נוסחאות מתקדמות של חיזוי מזג האוויר ולשפר משמעותית את יכולות התחזית שלהם.

למעשה, האפשרות לחזות את מזג האוויר היא אחת המהפכות המעניינות והמהירות בהיסטוריה. ממצב שבו איש לא יכול לחזות את מזג האוויר בעוד שלושה ימים, הגענו בתוך חצי מאה למצב בו מספיק מחשב וידע שניתן לרכוש באינטרנט, בכדי להיות חזאי חובב ברמה יפה ולהגיע אפילו לבד לתחזיות די מדויקות.

ועדיין, יש לא מעט קשיים גם היום בחיזוי מודרני של מזג האוויר. כיום, גם אם יש תצפיות מטאורולוגיות במרבית הארצות בכדור הארץ, אין או חסרות תצפיות מעל מדבריות ואוקיינוסים. יש גם סירוב משמעותי של ארצות במלחמה, לשלוח ולשתף נתונים מטאורולוגיים עם מדינות אחרות.

אז נכון, לתחזיות מזג האוויר יש עוד דרך ארוכה עד שנוכל לצפות לתחזית לגשם ברזולוציה של דקות או לטווחים של מעל 5 ימים. ועדיין, הידע והטכנולוגיה הקיימת מאפשרים לשירותי החיזוי בימינו לתת תחזיות מודרניות ואמינות ברוב המקרים לארבעת ולחמשת הימים הבאים. יש למטאורולוגיה המודרנית אפילו את היכולת לתת הערכות לא רעות לעשרת הימים הבאים.

בשלב הזה נכנסות וייכנסו ללא ספק מערכות תוכנה מבוססות למידה עמוקה (Deep Learning). מצוידות בכמויות דאטה עצומות שיוכנסו אליהן, מערכות אלה יאתרו בעצמן דפוסים וקשרים בהתפתחות מזג האוויר, שישפרו בעתיד הנראה לעין את התחזיות הרבה מעבר למה שאנו משערים.


הנה חזאי מסביר כיצד הוא חוזה את תחזית מזג האוויר (עברית):

http://youtu.be/7joNfy4Ru1E


תוכנות מתקדמות מאפשרות כיום תחזית מזג אוויר משופרת:

https://youtu.be/KP-6Mgt3q4g


למה החזאים עדיין טועים? (עברית)

https://youtu.be/uKqGAKosLP0


ותכנית חינוכית ארוכה על נושא מזג האוויר (עברית):

http://youtu.be/QNvPN7asA9o?long=yes
מי טען שעיבוד נתונים הוא רק גימיק אופנתי?



"דיברתי עם מיטב החוקרים ואני יכול להבטיח לכם שעיבוד נתונים זה סתם גימיק אופנתי שלא יחזיק מעמד שנה!"

כשעורך ספרי העסקים בהוצאת הספרים הנחשבת Francis Hall אמר את המשפט שלמעלה בשנת 1957 וזלזל בעיבוד הנתונים הממוחשב, הוא עשה את אחת הטעויות הגדולות בתולדות העולם העסקי.

פחות מ-20 שנה לאחר מכן כל העסקים הגדולים בכל העולם הפכו לגופים ממוחשבים ו-10 שנים נוספות אחרי כן גם עסקים קטנים אימצו בהמוניהם את בסיסי הנתונים והחישובים שבצעו המחשבים.

כיום ישנם מחשבי על שיודעים לעשות דברים בלתי נתפסים והעתיד עוד לפניהם. בינה מלאכותית, ביג דאטה, למידת מכונה ולמידה עמוקה - אלה רק חלק מהדברים המדהימים שעושים היום מחשבים, שהיו אמורים לפי ה"נבואה" ההיא להיות גימיק ותו לא...


הנה ווטסון של יבמ, מחשב העל הראשון שהביס מתחרים אנושיים בחידון הטלוויזיה ג'יופרדי והראה את העתיד של הבינה המלאכותית:

https://youtu.be/P18EdAKuC1U


הרצאה של האדם שהובס בידי ווטסון (מתורגם):

https://youtu.be/b2M-SeKey4o?long=yes


והרצאה על ווטסון והג'יאופרדי בטלוויזיה (עברית):

https://youtu.be/XGLmbXDEEdw?t=79s?long=yes
מהו זיהוי פנים?



ממצלמות אבטחה במרחב הציבורי, דרך מצלמות מעקב המתעדות מיליוני אנשים בערים ובדרכים ועד לסוכנויות המעקב הממשלתיות, לאחרונה נראה שהיא בכל מקום. היכולת לזהות פנים באופן דיגיטלי מתבססת על המרה של תווי הפנים של אדם למפת נתונים, שניתן להשוות למיליוני מפות נתונים אחרות ולמצוא במי מדובר.

מדובר בטכנולוגיית זיהוי פנים (Facial recognition), המבוססת על יכולת טכנולוגית מבוססת אלגוריתם, או תוכנה, שמסוגלת לזהות אדם על פי צילום דיגיטלי שלו, אם בתצלום ואם בסרט וידאו. מערכות זיהוי פנים רבות מתיימרות כיום לעשות זאת באופן אוטומטי.

אחת השיטות לזיהוי פנים היא על ידי השוואת תכונות תווי הפנים שבתמונה לתמונות שמאוחסנות במאגר נתונים. אלגוריתם פשוט למד כבר מזמן לזהות בזמן צילום דיגיטלי, פנים אנושיות וכך עשה פוקוס עליהם, כדי שהפנים לא יצאו מטושטשים.

בשנים האחרונות הפכו האלגוריתמים של זיהוי פנים מדויקים מבעבר. הם מאפשרים לעבד כמויות אדירות של מידע, במהירות וביעילות, כשהם נעזרים במאגרי נתונים ענקיים המכילים את פניהם של אזרחים רבים.

המדהים הוא שהרשתות החברתיות מהוות כיום את מאגר הנתונים הגדול מאי-פעם, כשלכל צילום מתווספים מיידית שמות המצולם ופרטים מזהים רבים. המרכזיות של המדיה החברתית בחיינו מהווה סיכון לא קטן לפרטיות שלנו וזה יילך ויתחדד, ככל שיימצאו שימושים חדשים לטכנולוגיות הללו.

כל השחקנים הטכנולוגיים הגדולים כבר שם. אם זו פייסבוק, שמזהה את חבריך בתמונות שהעלית לקיר שלך, או גוגל שמזהה לבעלי סמארטפונים את פניהם של המצולמים בתמונות שבנייד האנדרואיד שלהם. מיקרוסופט, שהצליחה לפתח אלגוריתמים לשלטים שמזהים את המתבונן ומציעים לו פרסומות מטורגטות, כלומר פרסומות שונות לכל אדם ומותאמות לנושאים שבהם הוא מתעניין, בצורה די דומה לפרסומות בדפדפן, שמתאימות את עצמן לחיפושים שלך במנוע החיפוש. מוצר אחר של מיקרוסופט המשתמש בזיהוי פנים, הוא מצלמה שמסוגלת להבחין בין תאומים זהים ולזהותם על אף הדימיון הרב ביניהם.

מערכות זיהוי פנים משמשות כיום לאבטחה, לזיהוי החברים המצולמים ברשתות חברתיות ולמעקב אחרי פושעים וטרוריסטים במקומות ציבוריים. לעתים קרובות הן מופעלות ביחד עם טכנולוגיות משלימות, שכן זיהוי פנים היא חלק מתחום הזיהוי הביומטרי. טכנולוגיות נוספות שמשמשות בזיהוי ביומטרי הן זיהוי טביעות אצבע, זיהוי דנ"א וזיהוי קשתית העין.


כך אנו מזהים פנים (עברית):

https://youtu.be/mTSsCYob9mo


זיהוי פנים טכנולוגי:

https://youtu.be/wve5JWX7yoc


זיהוי פנים כאמצעי תשלום (עברית):

https://youtu.be/9yyeH6CK5xk


על זיהוי פנים ופרטיות (עברית):

https://youtu.be/fU3OMXLAKNk


טכנולוגיית האבטחה שמתבססת על זיהוי פנים:

https://youtu.be/9k-rTVfLesQ


מראת הפלא שמזהה בין השאר רגשות של המתבונן בה:

https://youtu.be/uN1yB17S2bk


נראה שזיהוי הפנים של חלונות 10 לא מתבלבל בין תאומים זהים:

https://youtu.be/J1NL246P9Vg


ויש גם זיהוי פנים מעט מביך כמו אלגוריתם שמבטיח לזהות את הגיל של המצולם:

https://youtu.be/Wi8DLKPQqJ0
איך מתבצעת צביעה של תמונות ישנות?
איך תיראה תעשיית העתיד?
מה חכם בטלוויזיה החכמה?
מהי ראייה ממוחשבת במערכות זיהוי תמונה?
איך צובעים סרטי קולנוע ישנים?


אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

העולם הוא צבעוני ומופלא, אאוריקה כאן בשביל שתגלו אותו...

אלפי נושאים, תמונות וסרטונים, מפתיעים, מסקרנים וממוקדים.

ניתן לנווט בין הפריטים במגע, בעכבר, בגלגלת, או במקשי המקלדת

בואו לגלות, לחקור, ולקבל השראה!

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.