בכנס השנתי של משתמשי ענן גוגל (Google) בעולם – Google Cloud Next 17 – שנערך בשבוע שעבר בסן פרנסיסקו, אחד הנושאים המרתקים והמבטיחים היה שילוב של הפתרונות החדישים ביותר בעולמות הבינה המלאכותית ולימוד המכונה.
בינה מלאכותית (AI) הולכת ותופסת תפקיד מרכזי בארגונים, אך עסקים מתקשים לעמוד בקצב ההתפתחויות הטכנולוגיות של התחום. אחת ממטרותיה החשובות של גוגל היא להפוך את לימוד המכונה (Machine learning) לכלי שישרת ארגונים מכל גודל או מגזר תעשייה.
ארגונים רבים הופכים את לימוד המכונה לחלק מרכזי באסטרטגיית ניתוח המידע שלהם, ביניהם דיסני (Disney ), איירבוס (Airbus), Airbnb, ו-Ocado המהווים מקרי בוחן מעוררי השראה.
במליאת הפתיחה של הכנס, ד"ר פיי-פיי לי, מדענית ראשית לתחום הבינה המלאכותית ולימוד מכונה ב-Google Cloud, הכריזה על סדרת מוצרים, מחקרים ותכניות חינוכיות, שנועדו להבטיח שלימוד מכונה יהיה נגיש לכמה שיותר ארגונים, מדעני נתונים ומפתחים ברחבי העולם.
להבין את התוכן של קטעי וידיאו עם Cloud Video Intelligence API
השקת גרסת בטא של Cloud Video Intelligence API, מציעה כלי מהפכני למפתחים המשתמש במודלים חזקים של deep-learning, מבוסס על תשתיות כמו TensorFlow ומיושם על פלטפורמות וידיאו בסדרי הגודל של יוטיוב.
זהו API ראשון מסוגו בעולם, המאפשר למפתחים לבצע בקלות חיפוש ותחקור בתכנים של קטעי וידיאו, לספק מידע על ישויות או דמויות שמופיעות במהלך קטעי ווידיאו (שמות עצם כגון "כלב", "פרח", "אדם", או פעלים כגון "רץ", "שוחה", או "עף").
ה-API מסוגל אפילו להבנה קונטקסטואלית של הרגע המדויק בו מופיעה הדמות המבוקשת בסרטון. למשל, חיפוש של "נמר" יפיק תוצאות של כל הרגעים בהם מופיע נמר במהלך קטע הווידיאו בענן של גוגל.
"לגוגל יש היסטוריה ארוכה של עבודה עם חברות המדיה הגדולות בעולם, וכעת אנו עוזרים להן להפיק ערך ממידע בלתי-מובנה כמו קטעי וידיאו", אמרה פיי-פיי לי. "התאמנו את ה-API החדש לצרכים של ארגוני המדיה הגדולים ושל חברות טכנולוגיה מובילות, המעוניינות לבנות קטלוג מדיה או למצוא דרך קלה לנהל תוכן גולשים".
ההכרזה על ה-API החדש מצטרפת לרשימה ארוכה של API's הזמינים למפתחים בסביבת Google Cloud Machine Learning, ביניהם: Vision ,Video Intelligence ,Speech ,Natural Language ,Translation ו-Jobs.
מערך ה-API מאפשר ללקוחות גוגל לבנות את הדור הבא של האפליקציות, המסוגלות לראות, לשמוע ולהבין מידע בלתי-מובנה, ולהרחיב בכך את מגוון השימושים הפוטנציאליים של לימוד מכונה (machine learning), למטרות שונות החל מהמלצות על מוצרים באינטרנט, דרך ניתוח הדמיות רפואיות, ועד לזיהוי הונאות ועוד.
Cloud Machine Learning Engine מעתה זמין מסחרית
פיי-פיי לי הכריזה על זמינות מסחרית של Cloud ML Engine, כלי המאפשר לארגונים להריץ ולפרוש את המודלים שלהם בענן. Cloud ML Engine מציע את היתרונות של שירות מנוהל בבניית מודלים מותאמים אישית של לימוד-מכונה על בסיס TensorFlow, עם כל סוג של דטה ובכל קנה מידה. השירות ניתן לשילוב עם כל שירותי Google Cloud, כגון Cloud Dataflow לעיבוד מידע, Cloud Datalab למדעי נתונים ו-Google BigQuery ל-SQL analytics.
גוגל עובדת גם עם שותפים טכנולוגיים המציעים את Cloud ML Engine בפתרונות ובשירותים שלהם. שתי דוגמאות עדכניות לשותפים כאלה הן SpringML המשתמשת ב-Cloud ML Engine לאספקת אנליטיקה בזמן-אמת למשתמשי הקצה שלה, ו-SparkCognition אשר משתמשת בו כדי לזהות ולחסום מתקפות יום אפס (Zero-Day).
ללמוד ממומחי ה-machine learning של גוגל
כדי לעזור ללקוחות להפיק ערך מהיר מלימוד-מכונה, גוגל מעמידה לרשותם את Advanced Solution Lab, המאפשרת להיעזר במומחי לימוד-מכונה של גוגל וליישם כלים של ML לטיפול באתגרים הגדולים ביותר של הלקוחות. במהלך ההתנסות הייחודית ב-ASL, לקוחות יכולים לחקור וללמוד ממקרי בוחן קודמים ולרכוש בסיס איתן בנושאי לימוד-מכונה עם TensorFlow ועם Cloud ML Engine.
עדכון משמעותי בגרסת בטא 1.1 שלCloud Vision API
אחד מה-API's המצליחים ביותר של Google Cloud הוא Vision API, שמאז השקתו בשנת 2016 סייע למפתחים לפענח מטא-דטה של יותר ממיליארד תמונות. עתה גוגל חושפת גרסה חדשה שלו, הכוללת יכולות מתקדמות יותר שיאפשרו ללקוחות ארגוניים ושותפי גוגל לסווג סטים גדולים ומגוונים יותר של תמונות בענן.
בגרסתו החדשה, Cloud Vision API יכול לזהות מיליוני ישויות שונות מתוך מאגר הידע של גוגל (Google’s Knowledge Graph) ולהציע יכולות OCR מורחבות כמו פענוח טקסט המופיע במסמכים עתירי מידע (חוזים משפטיים, מאמרים מדעיים או ספרים שלמים).
היכולת של מחשבים לחקות את חוש הראייה האנושי, הופכות בזמן האחרון מ-"COOL Feature" למרכיב נחוץ ובסיסי אצל ארגונים מודרניים, וכעת Vision API של גוגל מבטיח שלכל לקוחות הענן תהיה גישה מהירה ומהימנה לטכנולוגיה זו.
אתר ולוח הנדל"ן Realtor.com נעזר ב-Cloud Vision API כדי לאפשר ללקוחותיו שירות מדהים – הלקוח מצלם בסמארטפון שלו כל בית, מבנה, או נכס נדל"ן בו הוא מתעניין, ויכול לקבל באופן מיידי מידע אודותיו.
"הודות לשירותי machine learning של גוגל, שיפרנו ב-24% את איכות השירות, בהשוואה לשירות המבוסס על מיקום בלבד", כך אמר דיוויד ווייט, סגן נשיא בכיר ב-Realtor.com.
לייעל את תהליך גיוס העובדים עם Cloud Jobs API
הכלי למפתחים Cloud Jobs API עושה שימוש בלימוד-מכונה כדי לסייע לאתרי דרושים לייעל ולדייק את תהליך החיפוש. מאז השקתו, משוב של לקוחות מובילים כמו CareerBuilder ,Dice ו-Jibe משפר את השירות עם יכולות חדשות כגון Commute Search, המתייחס להעדפת העובד בקשר למשך הנסיעה לעבודה או דרכי תחבורה מועדפות.
"השימוש בלימוד מכונה ו-Cloud Jobs API יסייע לנו לשפר את החוויה של מחפשי עבודה ולקצר את הפער בין תהליך החיפוש למציאת המשרה המתאימה ביותר, בזמן הנכון." אמר סיורד גהרינג, סגן נשיא ג'ונסון אנד ג'ונסון (Johnson & Johnson).
ד"ר פיי-פיי לי מלהיבה את הקהל עם יישומי AI ו-ML מעוררי השתאות של זיהוי (כמעט) כל אובייקט בווידיאו.
ד"ר פיי-פיי לי, מי שהקימה את מאגר התמונות הנסרק–נלמד-מפוענח הגדול בעולם, Imagenet, המבוסס בינת מלאכותית ולימוד מכונה, מובילה עתה את התחום בחטיבת הענן של גוגל, לתועלת לקוחותיה.