סט נתוני אימון לבינה מלאכותית שפותח על ידי OORT, ספקית פתרונות AI מבוזרים, זכה להצלחה משמעותית בפלטפורמת Kaggle של גוגל בחודשים האחרונים.
מערך הנתונים של OORT, הידוע בשם "Diverse Tools", שוחרר בתחילת אפריל וטיפס במהירות לעמוד הראשון במספר קטגוריות מרכזיות. Kaggle, פלטפורמה מקוונת בבעלות גוגל, משמשת לתחרויות, למידה ושיתוף פעולה בתחומי מדע הנתונים ולמידת מכונה.
רמקומאר סוברמניאם, תורם מרכזי בפרויקט הקריפטו-AI OpenLedger, אמר לאתר Cointelegraph כי "דירוג בעמוד הראשי של Kaggle הוא איתות חברתי חזק, המעיד על כך שמערך הנתונים מעורר עניין בקהילות הנכונות של מדעני נתונים, מהנדסי למידת מכונה ואנשי מקצוע בתחום".
מקס לי, מייסד ומנכ"ל OORT, הוסיף כי החברה "ראתה מדדי מעורבות מבטיחים המאשרים את הביקוש המוקדם והרלוונטיות" של נתוני האימון שנאספו באמצעות מודל מבוזר. הוא הדגיש כי "העניין האורגני מהקהילה, כולל שימוש פעיל ותרומות, מדגים כיצד צינורות נתונים מבוזרים מונעי-קהילה כמו אלה של OORT יכולים להשיג הפצה ומעורבות מהירות מבלי להסתמך על מתווכים ריכוזיים".
לי גם חשף כי OORT מתכננת לשחרר מספר מערכי נתונים בחודשים הקרובים, בהם סט נתונים של פקודות קוליות ברכב, פקודות קוליות לבית חכם וסט נתונים של וידאו deepfake המיועד לשפר אימות מדיה מבוסס בינה מלאכותית.
צוות Cointelegraph אימת באופן עצמאי כי מערך הנתונים הגיע לעמוד הראשון בקטגוריות הבאות של Kaggle: בינה מלאכותית כללית, קמעונאות וקניות, ייצור, והנדסה מוקדם יותר בחודש זה. נכון למועד הפרסום, המערך איבד את מיקומו לאחר עדכונים שבוצעו במערך הנתונים ב-6 במאי וב-14 במאי.
נתונים שפורסמו על ידי חברת המחקר בתחום ה-AI, Epoch AI, מעריכים כי נתוני אימון טקסט שנוצרו על ידי בני אדם יתמצו עד שנת 2028. הלחץ גבוה עד כדי כך שמשקיעים כעת מתווכים בעסקאות המעניקות זכויות לחומרים מוגנים בזכויות יוצרים לחברות בינה מלאכותית.
סוברמניאם הדגיש: "אנחנו נכנסים לעידן שבו נתוני תמונה באיכות גבוהה יהפכו נדירים יותר". הוא הכיר בכך שהמחסור הזה נעשה חמור יותר עקב הפופולריות הגוברת של "הרעלת תמונות" - טכניקה המאפשרת לאמנים לחבל במאמצי אימון של מודלים כדי להגן על עבודותיהם.
במצב זה, מערכי נתונים מבוססי-תמריצים ממקור קהילתי הופכים "יקרי ערך יותר מאי פעם", לדברי סוברמניאם. פרויקטים כאלה "יכולים להפוך לא רק לאלטרנטיבות, אלא לעמודי תווך של יישור AI ומקור בכלכלת הנתונים".
לקס סוקולין, שותף בקרן הון סיכון לבינה מלאכותית Generative Ventures, ציין כי למרות שלדעתו תוצאות אלו אינן קשות לשחזור, "זה מראה שפרויקטי קריפטו יכולים להשתמש בתמריצים מבוזרים כדי לארגן פעילות בעלת ערך כלכלי".
ההצלחה של OORT מדגימה את הפוטנציאל של מודלים מבוזרים לפתרון אתגרים משמעותיים בתחום הבינה המלאכותית, ובמיוחד המחסור בנתוני אימון איכותיים. עבור שוק הקריפטו הישראלי, זוהי דוגמה לאופן שבו טכנולוגיית בלוקצ'יין יכולה להשתלב עם צרכים עסקיים אמיתיים בתחום ה-AI, ולייצר ערך מוחשי מעבר לספקולציות.
חדשות, ניתוחים, והצעות מגוונת ישירות לתיבת האימייל שלכם!