המרדף אחר בינה מלאכותית שיכולה לנווט ולהבין את המורכבויות של סביבות תלת-ממדיות בקלות וביכולת הסתגלות של בני אדם הפכה זה מכבר לחזית הטכנולוגיה.
בלב המחקר הזה עומדת השאיפה ליצור סוכני בינה מלאכותית שלא רק תופסים את סביבתם אלא גם עוקבים אחר הוראות מורכבות המנוסחות בשפת יוצריהם האנושיים.
חוקרים פורצים את הגבולות של מה שבינה מלאכותית יכולה להשיג על ידי גישור על הפער בין פקודות מילוליות מופשטות לפעולות קונקרטיות בתוך עולמות דיגיטליים.
מקור תמונה;
https://storage.googleapis.com/
חוקרים מ-Google DeepMind ואוניברסיטת קולומביה הבריטית מתמקדים במסגרת פורצת דרך של AI, ה-Scalable, Instructable, Multiworld Agent (SIMA).
המסגרת הזו היא לא רק עוד כלי בינה מלאכותית אלא מערכת ייחודית שנועדה להכשיר סוכני בינה מלאכותית בסביבות תלת מימד מגוונות, ממעבדות מחקר מעוצבות בקפידה ועד למחוזות הרחבים של משחקי וידאו מסחריים.
הישימות האוניברסלית שלו מייחדת את SIMA, ומאפשרת לה להבין ולפעול לפי הוראות בכל סביבה וירטואלית, תכונה שיכולה לחולל מהפכה באופן שבו כולם מקיימים אינטראקציה עם AI.
יצירת AI רב-תכליתי שיכול לפרש ולפעול לפי הוראות בשפה טבעית אינה הישג של מה בכך. מערכות AI קודמות אומנו בסביבות ספציפיות, מה שמגביל את התועלת שלהן במצבים חדשים. כאן נכנסת SIMA לגישה החדשנית שלה. הכשרה בהגדרות וירטואליות שונות מאפשרת ל- SIMA להבין ולבצע מספר משימות, תוך קישור בין הוראות לשוניות לפעולות מתאימות. זה משפר את יכולת ההסתגלות שלו ומעמיק את הבנת השפה בהקשר של חללים תלת מימדיים שונים, צעד משמעותי קדימה בפיתוח AI.
כדי להתמודד עם אילוצים אלה, SIMA מאמצת גישה חדשנית המדגישה את ההכללה של הבנת השפה וביצוע פעולה על פני מספר סביבות. על ידי שילוב מגוון רחב של הגדרות וירטואליות במשטר האימונים שלה, SIMA זוכה לחשיפה לקשת רחבה של משימות ותרחישים. שיטת אימון זו מאפשרת ל-AI לפתח בסיס חזק המקשר בין הוראות לשוניות לפעולות מתאימות. גישה כזו משפרת את יכולת ההסתגלות של הבינה המלאכותית ומעשירה את הבנת השפה בהקשר של חללים תלת מימדיים מגוונים.
הטכנולוגיה העומדת בבסיס SIMA נבדלת בהסתמכותה על מערך נתונים רחב הכולל סביבות וירטואליות רבות. מערך נתונים זה משמש כסלע לאימון, ומאפשר ל-AI לנווט ולקיים אינטראקציה עם העולמות הדיגיטליים הללו בזמן אמת. תוך שימוש בממשקים דמויי אדם, SIMA מפגין יכולת יוצאת דופן להבין ולבצע מגוון רחב של משימות המונחה על ידי הניואנסים של השפה האנושית. היכולת הזו לתרגם הוראות מילוליות לפעולות פיזיות בתוך סביבות וירטואליות מדגישה את האופי פורץ הדרך של המתודולוגיה של SIMA.
הערכות של היכולות של SIMA חושפות את מיומנותה בביצוע משימות בתוך הגדרות מדומה, המשקפות צעדים משמעותיים באינטראקציה של AI עם סביבות תלת מימד. למרות ההתקדמות הללו, האתגר של שליטה מלאה במורכבות הגלומה בסביבות ובהוראות השפה נמשך. מכשולים אלה מדגישים את ההכרח במחקר ועידון מתמשכים, המדגישים את התהליך האיטרטיבי של חדשנות טכנולוגית.
לסיכום, ההשלכות של הפיתוח של SIMA הן עמוקות, וסוללות את הדרך לאפיקים חדשים של אינטראקציה בין בני אדם ובינה מלאכותית במרחבים וירטואליים.
הוא מבטיח לחולל מהפכה באופן שבו כולם חושבים ומקיימים אינטראקציה עם סביבות דיגיטליות. המסע לעבר AI שיכול לנווט ולהבין בצורה חלקה כל חלל תלת-ממדי דרך עדשת השפה האנושית עדיין נמשך.
כל הקרדיט על מחקר זה מגיע לחוקרי הפרויקט הזה ;