Google सीईओ सुंदर पिचाई म्हणाले की सर्वम एआयने केलेल्या कामामुळे ते प्रभावित झाले आहेत. सध्या सुरू असलेल्या इंडिया एआय इम्पॅक्ट समिट 2026 मध्ये बोलताना पिचाई म्हणाले, “मी भारतात प्रत्येक वेळी प्रवास करताना विकासक ऊर्जा शोधतो, ती कोणत्याही प्रकारची नाही, दुसऱ्यापेक्षा दुसरी नाही,” ते पुढे म्हणाले की देशातील उद्योजकता इकोसिस्टम “समृद्ध” होत आहे. पिचाई यांनी भारतीय भाषा आणि संदर्भांना अनुरूप स्थानिक एआय मॉडेल्स विकसित करण्यासाठी सर्वम एआयला विशेषत: हायलाइट केले की “सरवमने स्थानिक एआय मॉडेल विकसित करण्याचे काम केले आहे….मला त्यात कोणतेही अडथळे दिसत नाहीत आणि मला वाटते की ते खूप चांगले स्थान आहे”. एआय स्टार्टअपने अलीकडेच इंटरनेटवर वादळ मिळवले आहे आणि कंपनीने दावा केला आहे की त्याच्या एआय मॉडेलने Google च्या जेमिनी आणि ओपनएआयच्या चॅटजीपीटीसह AI मधील काही मोठ्या नावांना मागे टाकले आहे. “सर्वम व्हिजनने जेमिनी 3 प्रो सारख्या फ्रंटियर मॉडेल्स आणि डीपसीक ओसीआर 2 सारख्या अलीकडील ओसीआर मॉडेल्सपेक्षा olmOCR-बेंच (इंग्रजी फक्त उपसंच) वर 84.3% ची अत्याधुनिक अचूकता प्राप्त केली आहे,” प्रत्युष कुमार, CEO, सर्वम AI यांनी लिहिले.
भारताचे सर्वम AI काय आहे ज्याचे सुंदर पिचाई यांनी कौतुक केले
सर्वमची स्थापना विवेक राघवन आणि प्रत्युष कुमार यांनी ऑगस्ट 2023 मध्ये केली होती. एका ब्लॉग पोस्टमध्ये, कंपनीने स्पष्ट केले की त्याचे सर्वम AI मॉडेल इमेज कॅप्शनिंग, सीन टेक्स्ट रेकग्निशन, चार्ट इंटरप्रिटेशन आणि कॉम्प्लेक्स टेबल पार्सिंगसह अनेक दृश्य समजून घेण्यास सक्षम आहे. कंपनीचे एक उद्दिष्ट भारताचे ज्ञान अनलॉक करणे आहे जे भौतिक दस्तऐवज, स्कॅन केलेले संग्रहण आणि ऐतिहासिक संग्रहांमध्ये एम्बेड केलेले आहे. आणखी एक महत्त्वाची समस्या ज्यावर कंपनी काम करत आहे ती म्हणजे भारतीय वापरकर्त्यांसाठी AI कार्यक्षमता आणणे. “बहुतेक जागतिक मॉडेल भारतीय भाषांना दुय्यम मानतात, ज्यामुळे प्रादेशिक लिपींची अचूकता कमी होते. अचूकतेच्या सीमांना पुढे नेण्यासोबतच, आमचे VLM हे अनुमान-कार्यक्षम 3B राज्य-स्पेस मॉडेल आहे,” कंपनीने म्हटले आहे.सर्वम एआय मॉडेल, कंपनी म्हणते, विविध आर्थिक दस्तऐवज, साहित्य, वर्तमानपत्रे, ऐतिहासिक ग्रंथ आणि बरेच काही यासह 22 अधिकृत भारतीय भाषांचा समावेश असलेल्या उच्च-गुणवत्तेच्या डेटासेटवर प्रशिक्षण दिले जाते.सर्वम AI चे स्पीच रेकग्निशन मॉडेल 10 भारतीय भाषांना एकाच 74-दशलक्ष पॅरामीटर मॉडेलमध्ये समर्थन देते जे एका डिव्हाइसवर अंदाजे 294MB व्यापते. वापरकर्त्याने ती निवडण्याची आवश्यकता न ठेवता बोलली जात असलेली भाषा ते आपोआप ओळखू शकते. मॉडेल सुमारे 8.5x रिअल-टाइमवर भाषणावर प्रक्रिया करू शकते आणि क्वालकॉम स्नॅपड्रॅगन 8 Gen 3 चिपसेटवर 300 मिलीसेकंदपेक्षा कमी वेळ-टू-फर्स्ट-टोकन प्रदान करते. त्याच्या स्पीच सिंथेसिस मॉडेलमध्ये सुमारे 60 एमबी आणि 24 दशलक्ष पॅरामीटर्सचे डिव्हाइस फूटप्रिंट आहे. मॉडेल मानक बेंचमार्कवर 0.0173 चा सरासरी वर्ण त्रुटी दर प्राप्त करतो, हे दर्शविते की संश्लेषित भाषण भाषांमधील अभिप्रेत मजकूराशी जवळून जुळते. सानुकूल व्हॉईस क्लोनिंग देखील त्यावर समर्थित आहे म्हणजे सुमारे एक तास ऑडिओ डेटा वापरून नवीन आवाज जोडला जाऊ शकतो आणि त्याच 60MB मॉडेल फाइलमध्ये तैनात केला जाऊ शकतो.दुसरीकडे, भाषांतर मॉडेलमध्ये 150 दशलक्ष पॅरामीटर्स आणि सुमारे 334MB चे ऑन-डिव्हाइस फूटप्रिंट आहेत. हे मध्यवर्ती भाषेतून मार्ग न काढता, 10 भारतीय भाषा आणि इंग्रजीसह 110 भाषांच्या जोड्यांमध्ये द्विदिशात्मक भाषांतर हाताळते.
सर्वम AI मिथुन आणि ChatGPT पेक्षा कसे वेगळे आहे
भारतातील सर्वम एआय, आणि मिथुन आणि चॅटजीपीटी यांच्यातील महत्त्वाच्या फरकांपैकी एक म्हणजे भारतीय भाषा इंग्रजीला प्राधान्य देणे आणि बाकीच्यांना दुय्यम मानणे. हे 22 भारतीय भाषांमध्ये प्रशिक्षित असल्याने, ते प्रादेशिक लिपींसाठी उच्च अचूकता देऊ शकते.इतर मॉडेल्स केवळ कागदपत्रे किंवा प्रतिमांमधून मजकूर काढण्यासाठी पुरेसे सक्षम आहेत, तर सर्वमएआय अधिक चांगल्या प्रकारे समजून घेण्यासाठी आणि अतिरिक्त ज्ञानासाठी व्हिज्युअल घटकांचा अर्थ लावू शकते. हे भारतीय भाषांसाठी मोठ्या प्रमाणात इंडिक ओसीआर बेंचमार्कसह समजून घेण्याच्या पातळीवर विविध जटिल दस्तऐवजांवर चांगली कामगिरी सुनिश्चित करते.
सर्वम एआय मॉडेलची उपलब्धता
डॉक्युमेंट इंटेलिजेंस API फेब्रुवारी 2026 साठी विनामूल्य आहे, वापरकर्त्यांना सर्वम व्हिजनसह स्केलवर एक्सप्लोर करण्यास आणि तयार करण्यास अनुमती देते, आज पूर्णपणे विनामूल्य प्रारंभ करून.
भारताचे सर्वम एआय: प्रमुख वैशिष्ट्ये
भारताच्या सर्वम एआय मॉडेलच्या प्रमुख वैशिष्ट्यांचा येथे थोडक्यात सारांश आहे:
- मल्टिमोडल व्हिजन-लँग्वेज: हे इमेज कॅप्शनिंग, चार्ट किंवा टेबल इंटरप्रिटेशन अधिक सहजपणे सक्षम करण्यासाठी प्रतिमा आणि मजकूर एकत्रितपणे समजून घेण्यास मदत करते.
- दस्तऐवज समजून घेणे (भारतीय भाषांवर केंद्रित): यात ऐतिहासिक ग्रंथ आणि स्कॅन केलेल्या दस्तऐवजांसह 22 भारतीय भाषांसाठी उच्च-अचूकता OCR आणि ज्ञान निष्कर्षण आहे.
- चार्ट आणि डेटा इंटरप्रिटेशन: सर्वम एआय मजकूरांपेक्षा अधिक समजण्यास सक्षम आहे. चार्ट, डेटा, चित्रे आणि दस्तऐवजांचे दृश्य विश्लेषण.
- बहुभाषिक व्हिज्युअल: एआय मॉडेल एकाच दस्तऐवजातील अनेक भाषांमधील व्हिज्युअल घटक समजते आणि त्याचा अर्थ लावते.
- आघाडीची कामगिरी: सर्वम AI जागतिक इंग्रजी बेंचमार्कमध्ये उत्कृष्ट आहे आणि भारतीय भाषांसाठी सर्वम इंडिक ओसीआर खंडपीठ सादर करते.
- प्रवेशयोग्य API: त्याचे दस्तऐवज इंटेलिजन्स API उत्पादनासाठी तयार आहेत आणि फेब्रुवारी 2026 मध्ये प्रयोगासाठी वापरण्यासाठी विनामूल्य आहेत.
Source link
Auto GoogleTranslater News









