כיצד בינה מלאכותית התחילה לצייר?
הבינה המלאכותית היצירתית (GenAI) כמו DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.
הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצרת AI, לציירת, צלמת ועוד כל מיני סוגי אמנים - אבל במקרה שלה - תמיד באינטליגנציה מלאכותית.
באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימי-בייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ואפילו מדהימים.
ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.
להישג המקורי של DALL-E קמו די מהר מתחרים איכותיים לא פחות ואף יותר. הם מציעים עולם חדש וחסר תקדים של ציירים בינתיים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.
איש לא יודע בדיוק כיצד המנועים השונים פועלים, אבל זו עבודה מדהימה של למידה עמוקה שמעבדת בעצמה את הדאטה ממיליוני תמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.
התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית ותחרות של חברות ומפתחי קוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין. השטח מלא במודלים שבראשם מידג'רני, אידיאוגרם ו-Flux, המודל בקוד פותח שמייצר תוצרים שומטי לסתות.
הבינה המלאכותית היצירתית (GenAI) כמו DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.
הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצרת AI, לציירת, צלמת ועוד כל מיני סוגי אמנים - אבל במקרה שלה - תמיד באינטליגנציה מלאכותית.
באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימי-בייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ואפילו מדהימים.
ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.
להישג המקורי של DALL-E קמו די מהר מתחרים איכותיים לא פחות ואף יותר. הם מציעים עולם חדש וחסר תקדים של ציירים בינתיים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.
איש לא יודע בדיוק כיצד המנועים השונים פועלים, אבל זו עבודה מדהימה של למידה עמוקה שמעבדת בעצמה את הדאטה ממיליוני תמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.
התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית ותחרות של חברות ומפתחי קוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין. השטח מלא במודלים שבראשם מידג'רני, אידיאוגרם ו-Flux, המודל בקוד פותח שמייצר תוצרים שומטי לסתות.
קישורים מצורפים: