यंत्र अधिगम
मशीन लर्निंग ( एमएल ) कंप्यूटर एल्गोरिदम का अध्ययन है जो अनुभव के माध्यम से और डेटा के उपयोग से स्वचालित रूप से सुधार करता है। [१] इसे कृत्रिम बुद्धिमत्ता के एक भाग के रूप में देखा जाता है । मशीन लर्निंग एल्गोरिदम नमूना डेटा के आधार पर एक मॉडल का निर्माण करते हैं, जिसे " प्रशिक्षण डेटा " के रूप में जाना जाता है , ताकि ऐसा करने के लिए स्पष्ट रूप से प्रोग्राम किए बिना भविष्यवाणियां या निर्णय किए जा सकें। [२] मशीन लर्निंग एल्गोरिदम का उपयोग विभिन्न प्रकार के अनुप्रयोगों में किया जाता है, जैसे कि दवा, ईमेल फ़िल्टरिंग और कंप्यूटर विज़न में , जहाँ आवश्यक कार्यों को करने के लिए पारंपरिक एल्गोरिदम विकसित करना मुश्किल या असंभव है। [३]
मशीन लर्निंग का एक उपसमुच्चय कम्प्यूटेशनल आँकड़ों से निकटता से संबंधित है , जो कंप्यूटर का उपयोग करके भविष्यवाणियाँ करने पर केंद्रित है; लेकिन सभी मशीन लर्निंग सांख्यिकीय शिक्षा नहीं है। गणितीय अनुकूलन का अध्ययन मशीन लर्निंग के क्षेत्र में विधियों, सिद्धांत और अनुप्रयोग डोमेन को वितरित करता है। डेटा माइनिंग अध्ययन का एक संबंधित क्षेत्र है, जो अप्रशिक्षित शिक्षण के माध्यम से खोजपूर्ण डेटा विश्लेषण पर ध्यान केंद्रित करता है । [५] [६] व्यावसायिक समस्याओं में इसके अनुप्रयोग में, मशीन लर्निंग को प्रेडिक्टिव एनालिटिक्स भी कहा जाता है ।
अवलोकन
मशीन लर्निंग में कंप्यूटर को यह पता लगाना शामिल है कि ऐसा करने के लिए स्पष्ट रूप से प्रोग्राम किए बिना वे कैसे कार्य कर सकते हैं। इसमें कंप्यूटर प्रदान किए गए डेटा से सीखना शामिल है ताकि वे कुछ कार्यों को पूरा कर सकें। कंप्यूटर को सौंपे गए सरल कार्यों के लिए, मशीन को यह बताने वाले एल्गोरिदम को प्रोग्राम करना संभव है कि हाथ में समस्या को हल करने के लिए आवश्यक सभी चरणों को कैसे निष्पादित किया जाए; कंप्यूटर की ओर से, सीखने की कोई आवश्यकता नहीं है। अधिक उन्नत कार्यों के लिए, मानव के लिए आवश्यक एल्गोरिदम को मैन्युअल रूप से बनाना चुनौतीपूर्ण हो सकता है। व्यवहार में, यह मशीन को अपने स्वयं के एल्गोरिथ्म को विकसित करने में मदद करने के लिए और अधिक प्रभावी हो सकता है, बजाय इसके कि मानव प्रोग्रामर हर आवश्यक कदम निर्दिष्ट करें। [7]
मशीन लर्निंग का अनुशासन कंप्यूटर को ऐसे कार्यों को पूरा करने के लिए सिखाने के लिए विभिन्न तरीकों को नियोजित करता है जहां कोई पूरी तरह से संतोषजनक एल्गोरिदम उपलब्ध नहीं है। ऐसे मामलों में जहां बड़ी संख्या में संभावित उत्तर मौजूद हैं, एक दृष्टिकोण कुछ सही उत्तरों को मान्य के रूप में लेबल करना है। यह तब कंप्यूटर के लिए प्रशिक्षण डेटा के रूप में उपयोग किया जा सकता है ताकि वह सही उत्तरों को निर्धारित करने के लिए उपयोग किए जाने वाले एल्गोरिदम में सुधार कर सके। उदाहरण के लिए, डिजिटल कैरेक्टर रिकग्निशन के कार्य के लिए एक सिस्टम को प्रशिक्षित करने के लिए, हस्तलिखित अंकों के MNIST डेटासेट का अक्सर उपयोग किया जाता है। [7]
इतिहास और अन्य क्षेत्रों से संबंध
अवधि मशीन सीखने द्वारा 1959 में बनाया गया था आर्थर शमूएल , एक अमेरिकी IBMer के क्षेत्र में और अग्रणी कंप्यूटर गेमिंग और कृत्रिम बुद्धि । [८] [९] १९ ६० के दशक के दौरान मशीन लर्निंग रिसर्च की एक प्रतिनिधि पुस्तक निल्सन की लर्निंग मशीन पर किताब थी, जो ज्यादातर पैटर्न वर्गीकरण के लिए मशीन लर्निंग से संबंधित थी। [१०] पैटर्न मान्यता से संबंधित रुचि १९७० के दशक में जारी रही, जैसा कि १९७३ में डूडा और हार्ट द्वारा वर्णित किया गया था। [११] १९८१ में शिक्षण रणनीतियों का उपयोग करने पर एक रिपोर्ट दी गई थी ताकि एक तंत्रिका नेटवर्क ४० वर्णों (२६ अक्षरों, १०) को पहचानना सीख सके। अंक, और 4 विशेष प्रतीक) एक कंप्यूटर टर्मिनल से। [12]
टॉम एम। मिशेल ने मशीन लर्निंग क्षेत्र में अध्ययन किए गए एल्गोरिदम की एक व्यापक रूप से उद्धृत, अधिक औपचारिक परिभाषा प्रदान की: "एक कंप्यूटर प्रोग्राम को कार्य टी के कुछ वर्ग के संबंध में अनुभव ई से सीखने के लिए कहा जाता है और प्रदर्शन माप पी यदि कार्यों पर इसका प्रदर्शन होता है में टी , के रूप में द्वारा मापा पी , अनुभव के साथ बेहतर बनाता है ई । " [१३] कार्यों की यह परिभाषा जिसमें मशीन लर्निंग का संबंध है, संज्ञानात्मक शब्दों में क्षेत्र को परिभाषित करने के बजाय एक मौलिक रूप से परिचालन परिभाषा प्रदान करता है । यह एलन ट्यूरिंग के अपने पेपर " कंप्यूटिंग मशीनरी एंड इंटेलिजेंस " के प्रस्ताव का अनुसरण करता है , जिसमें प्रश्न "क्या मशीनें सोच सकती हैं?" इस प्रश्न के साथ प्रतिस्थापित किया जाता है "क्या मशीनें वह कर सकती हैं जो हम (सोचने वाली संस्थाओं के रूप में) कर सकते हैं?"। [14]
आधुनिक मशीन लर्निंग के दो उद्देश्य हैं, एक है विकसित किए गए मॉडल के आधार पर डेटा को वर्गीकृत करना, दूसरा उद्देश्य इन मॉडलों के आधार पर भविष्य के परिणामों की भविष्यवाणी करना है। डेटा को वर्गीकृत करने के लिए विशिष्ट एक काल्पनिक एल्गोरिथम, पर्यवेक्षित शिक्षण के साथ युग्मित मोल्स के कंप्यूटर विज़न का उपयोग कर सकता है ताकि इसे कैंसरग्रस्त मोल को वर्गीकृत करने के लिए प्रशिक्षित किया जा सके। जबकि स्टॉक ट्रेडिंग के लिए मशीन लर्निंग एल्गोरिदम भविष्य की संभावित भविष्यवाणियों के व्यापारी को सूचित कर सकता है। [15]
कृत्रिम होशियारी


एक वैज्ञानिक प्रयास के रूप में, मशीन लर्निंग कृत्रिम बुद्धिमत्ता की खोज से विकसित हुई। एआई के शुरुआती दिनों में एक अकादमिक अनुशासन के रूप में , कुछ शोधकर्ता मशीनों को डेटा से सीखने में रुचि रखते थे। उन्होंने विभिन्न प्रतीकात्मक तरीकों के साथ समस्या को हल करने का प्रयास किया, साथ ही जिसे तब " तंत्रिका नेटवर्क " कहा गया था ; ये ज्यादातर परसेप्ट्रोन और अन्य मॉडल थे जिन्हें बाद में सांख्यिकी के सामान्यीकृत रैखिक मॉडल के पुनर्निवेश के रूप में पाया गया । [१८] संभाव्य तर्क को भी विशेष रूप से स्वचालित चिकित्सा निदान में नियोजित किया गया था । [१९] : ४८८
हालाँकि, तार्किक, ज्ञान-आधारित दृष्टिकोण पर बढ़ते जोर ने AI और मशीन लर्निंग के बीच दरार पैदा कर दी। संभाव्य प्रणालियाँ डेटा अधिग्रहण और प्रतिनिधित्व की सैद्धांतिक और व्यावहारिक समस्याओं से ग्रस्त थीं। [१९] : ४८८ १९८० तक, विशेषज्ञ प्रणालियाँ एआई पर हावी हो गई थीं, और आँकड़े अनुकूल नहीं थे। [२०] एआई के भीतर प्रतीकात्मक/ज्ञान-आधारित सीखने पर काम जारी रहा, जिससे आगमनात्मक तर्क प्रोग्रामिंग हुई , लेकिन अनुसंधान की अधिक सांख्यिकीय रेखा अब एआई के क्षेत्र से बाहर थी, पैटर्न मान्यता और सूचना पुनर्प्राप्ति में । [१९] : ७०८-७१०; लगभग उसी समय एआई और कंप्यूटर विज्ञान द्वारा 755 तंत्रिका नेटवर्क अनुसंधान को छोड़ दिया गया था । यह पंक्ति भी ऐ / सीएस क्षेत्र के बाहर "के रूप में जारी किया गया था, Connectionism ", सहित अन्य विषयों के शोधकर्ताओं द्वारा Hopfield , Rumelhart और हिंटन । उनकी मुख्य सफलता 1980 के दशक के मध्य में बैकप्रॉपैगेशन के पुनर्निमाण के साथ आई । [१९] : २५
मशीन लर्निंग (एमएल), एक अलग क्षेत्र के रूप में पुनर्गठित, 1990 के दशक में फलने-फूलने लगा। इस क्षेत्र ने अपने लक्ष्य को कृत्रिम बुद्धिमत्ता से व्यावहारिक प्रकृति की हल करने योग्य समस्याओं से निपटने के लिए बदल दिया। इसने एआई से विरासत में मिले प्रतीकात्मक दृष्टिकोणों से ध्यान हटा दिया , और सांख्यिकी और संभाव्यता सिद्धांत से उधार लिए गए तरीकों और मॉडलों की ओर । [20]
2020 तक, कई स्रोतों का कहना है कि मशीन लर्निंग एआई का एक उपक्षेत्र बना हुआ है। [२१] [२२] [१६] मुख्य असहमति यह है कि क्या सभी एमएल एआई का हिस्सा हैं, क्योंकि इसका मतलब यह होगा कि एमएल का उपयोग करने वाला कोई भी दावा कर सकता है कि वे एआई का उपयोग कर रहे हैं। दूसरों का विचार है कि सभी एमएल एआई का हिस्सा नहीं हैं [२३] [२४] [२५] जहां एमएल का केवल एक 'बुद्धिमान' उपसमुच्चय एआई का हिस्सा है। [26]
एमएल और एआई में क्या अंतर है, इस सवाल का जवाब जूडिया पर्ल ने द बुक ऑफ व्हाई में दिया है । [२७] तदनुसार एमएल निष्क्रिय अवलोकनों के आधार पर सीखता है और भविष्यवाणी करता है, जबकि एआई का तात्पर्य पर्यावरण के साथ बातचीत करने वाले एजेंट से है जो सीखने और कार्रवाई करने के लिए अपने लक्ष्यों को सफलतापूर्वक प्राप्त करने की संभावना को अधिकतम करता है। [30]
डेटा खनन
मशीन लर्निंग और डेटा माइनिंग अक्सर समान विधियों को नियोजित करते हैं और महत्वपूर्ण रूप से ओवरलैप करते हैं, लेकिन मशीन लर्निंग भविष्यवाणी पर केंद्रित है, प्रशिक्षण डेटा से सीखे गए ज्ञात गुणों के आधार पर , डेटा माइनिंग डेटा में (पहले) अज्ञात गुणों की खोज पर केंद्रित है (यह है डेटाबेस में ज्ञान की खोज का विश्लेषण चरण )। डेटा माइनिंग कई मशीन लर्निंग विधियों का उपयोग करता है, लेकिन विभिन्न लक्ष्यों के साथ; दूसरी ओर, मशीन लर्निंग डेटा माइनिंग विधियों को "अनपर्यवेज़्ड लर्निंग" के रूप में या सीखने की सटीकता में सुधार के लिए प्रीप्रोसेसिंग चरण के रूप में भी नियोजित करता है। इन दो शोध समुदायों के बीच अधिकांश भ्रम (जिनमें अक्सर अलग-अलग सम्मेलन और अलग-अलग पत्रिकाएं होती हैं, ईसीएमएल पीकेडीडी एक प्रमुख अपवाद है) उन बुनियादी धारणाओं से आता है जिनके साथ वे काम करते हैं: मशीन सीखने में, प्रदर्शन का मूल्यांकन आमतौर पर क्षमता के संबंध में किया जाता है। ज्ञात ज्ञान का पुनरुत्पादन , जबकि ज्ञान की खोज और डेटा खनन (केडीडी) में मुख्य कार्य पहले अज्ञात ज्ञान की खोज है । ज्ञात ज्ञान के संबंध में मूल्यांकन किया जाता है, एक गैर-सूचित (अनपर्यवेक्षित) विधि आसानी से अन्य पर्यवेक्षित विधियों द्वारा बेहतर प्रदर्शन किया जाएगा, जबकि एक विशिष्ट केडीडी कार्य में, प्रशिक्षण डेटा की अनुपलब्धता के कारण पर्यवेक्षित विधियों का उपयोग नहीं किया जा सकता है।
अनुकूलन
मशीन लर्निंग का अनुकूलन के साथ घनिष्ठ संबंध भी है : कई सीखने की समस्याएं उदाहरणों के प्रशिक्षण सेट पर कुछ हानि फ़ंक्शन को कम करने के रूप में तैयार की जाती हैं। हानि कार्य मॉडल की भविष्यवाणियों और वास्तविक समस्या उदाहरणों के बीच विसंगति को व्यक्त करते हैं (उदाहरण के लिए, वर्गीकरण में, कोई उदाहरणों के लिए एक लेबल असाइन करना चाहता है, और मॉडल को एक सेट के पूर्व-असाइन किए गए लेबल की सही भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है। उदाहरण)। [31]
सामान्यकरण
अनुकूलन और मशीन सीखने के बीच का अंतर सामान्यीकरण के लक्ष्य से उत्पन्न होता है: जबकि अनुकूलन एल्गोरिदम एक प्रशिक्षण सेट पर नुकसान को कम कर सकता है, मशीन सीखने का संबंध अनदेखी नमूनों पर नुकसान को कम करने से है। विभिन्न शिक्षण एल्गोरिदम के सामान्यीकरण की विशेषता वर्तमान शोध का एक सक्रिय विषय है, विशेष रूप से गहन शिक्षण एल्गोरिदम के लिए।
आंकड़े
मशीन लर्निंग और सांख्यिकी विधियों के संदर्भ में निकट से संबंधित क्षेत्र हैं, लेकिन उनके मुख्य लक्ष्य में अलग हैं: आँकड़े एक नमूने से जनसंख्या अनुमान निकालते हैं , जबकि मशीन लर्निंग सामान्यीकरण योग्य भविष्य कहनेवाला पैटर्न ढूंढता है। [३२] माइकल आई. जॉर्डन के अनुसार , मशीन लर्निंग के विचार, पद्धति संबंधी सिद्धांतों से लेकर सैद्धांतिक उपकरणों तक, सांख्यिकी में एक लंबा पूर्व-इतिहास रहा है। [३३] उन्होंने समग्र क्षेत्र को कॉल करने के लिए प्लेसहोल्डर के रूप में डेटा विज्ञान शब्द का भी सुझाव दिया । [33]
लियो ब्रेमैन ने दो सांख्यिकीय मॉडलिंग प्रतिमानों को प्रतिष्ठित किया: डेटा मॉडल और एल्गोरिथम मॉडल, [३४] जिसमें "एल्गोरिदमिक मॉडल" का अर्थ कमोबेश मशीन लर्निंग एल्गोरिदम जैसे रैंडम फ़ॉरेस्ट है ।
कुछ सांख्यिकीविदों ने मशीन लर्निंग के तरीकों को अपनाया है, जिससे एक संयुक्त क्षेत्र बन गया है जिसे वे सांख्यिकीय शिक्षण कहते हैं । [35]
सिद्धांत
एक शिक्षार्थी का मुख्य उद्देश्य अपने अनुभव से सामान्यीकरण करना है। [४] [३६] इस संदर्भ में सामान्यीकरण एक सीखने की मशीन की क्षमता है जो सीखने के डेटा सेट का अनुभव करने के बाद नए, अनदेखे उदाहरणों / कार्यों पर सटीक रूप से प्रदर्शन करती है। प्रशिक्षण के उदाहरण कुछ सामान्य रूप से अज्ञात संभाव्यता वितरण (घटनाओं के स्थान का प्रतिनिधि माना जाता है) से आते हैं और शिक्षार्थी को इस स्थान के बारे में एक सामान्य मॉडल का निर्माण करना होता है जो इसे नए मामलों में पर्याप्त सटीक भविष्यवाणियां करने में सक्षम बनाता है।
मशीन लर्निंग एल्गोरिदम का कम्प्यूटेशनल विश्लेषण और उनका प्रदर्शन सैद्धांतिक कंप्यूटर विज्ञान की एक शाखा है जिसे कम्प्यूटेशनल लर्निंग थ्योरी के रूप में जाना जाता है । क्योंकि प्रशिक्षण सेट सीमित हैं और भविष्य अनिश्चित है, सीखने का सिद्धांत आमतौर पर एल्गोरिदम के प्रदर्शन की गारंटी नहीं देता है। इसके बजाय, प्रदर्शन पर संभाव्य सीमाएं काफी सामान्य हैं। पूर्वाग्रह-विचरण अपघटन एक तरह से सामान्यीकरण अंदाजा लगाना है त्रुटि ।
सामान्यीकरण के संदर्भ में सर्वश्रेष्ठ प्रदर्शन के लिए, परिकल्पना की जटिलता को डेटा में अंतर्निहित फ़ंक्शन की जटिलता से मेल खाना चाहिए। यदि परिकल्पना फलन से कम जटिल है, तो मॉडल ने डेटा को कम फिट किया है। यदि प्रतिक्रिया में मॉडल की जटिलता बढ़ जाती है, तो प्रशिक्षण त्रुटि कम हो जाती है। लेकिन अगर परिकल्पना बहुत जटिल है, तो मॉडल ओवरफिटिंग के अधीन है और सामान्यीकरण खराब होगा। [37]
प्रदर्शन सीमा के अलावा, सीखने के सिद्धांतकार समय की जटिलता और सीखने की व्यवहार्यता का अध्ययन करते हैं। कम्प्यूटेशनल लर्निंग थ्योरी में, एक गणना को व्यवहार्य माना जाता है यदि इसे बहुपद समय में किया जा सकता है । समय जटिलता परिणाम दो प्रकार के होते हैं । सकारात्मक परिणाम बताते हैं कि बहुपद समय में कार्यों के एक निश्चित वर्ग को सीखा जा सकता है। नकारात्मक परिणाम बताते हैं कि कुछ वर्गों को बहुपद समय में नहीं सीखा जा सकता है।
दृष्टिकोण
सीखने की प्रणाली के लिए उपलब्ध "सिग्नल" या "फीडबैक" की प्रकृति के आधार पर मशीन लर्निंग दृष्टिकोण को पारंपरिक रूप से तीन व्यापक श्रेणियों में विभाजित किया जाता है:
- पर्यवेक्षित शिक्षण : कंप्यूटर को "शिक्षक" द्वारा दिए गए उदाहरण इनपुट और उनके वांछित आउटपुट के साथ प्रस्तुत किया जाता है, और लक्ष्य एक सामान्य नियम सीखना है जो आउटपुट को इनपुट मैप करता है।
- अनुपयोगी शिक्षण : शिक्षण एल्गोरिथम को कोई लेबल नहीं दिया जाता है, इसके इनपुट में संरचना खोजने के लिए इसे अपने आप छोड़ दिया जाता है। अनुपयोगी सीखना अपने आप में एक लक्ष्य हो सकता है (डेटा में छिपे हुए पैटर्न की खोज करना) या अंत की ओर एक साधन ( फीचर लर्निंग )।
- सुदृढीकरण सीखना : एक कंप्यूटर प्रोग्राम एक गतिशील वातावरण के साथ बातचीत करता है जिसमें उसे एक निश्चित लक्ष्य (जैसे वाहन चलाना या प्रतिद्वंद्वी के खिलाफ खेल खेलना) करना चाहिए। जैसे ही यह अपनी समस्या स्थान को नेविगेट करता है, कार्यक्रम को प्रतिक्रिया प्रदान की जाती है जो पुरस्कारों के समान होती है, जिसे वह अधिकतम करने का प्रयास करता है। [४]
पर्यवेक्षित अध्ययन

पर्यवेक्षित शिक्षण एल्गोरिदम डेटा के एक सेट का गणितीय मॉडल बनाते हैं जिसमें इनपुट और वांछित आउटपुट दोनों शामिल होते हैं। [३८] डेटा को प्रशिक्षण डेटा के रूप में जाना जाता है , और इसमें प्रशिक्षण उदाहरणों का एक सेट होता है। प्रत्येक प्रशिक्षण उदाहरण में एक या अधिक इनपुट और वांछित आउटपुट होता है, जिसे पर्यवेक्षी संकेत के रूप में भी जाना जाता है। गणितीय मॉडल में, प्रत्येक प्रशिक्षण उदाहरण को एक सरणी या वेक्टर द्वारा दर्शाया जाता है, जिसे कभी-कभी एक फीचर वेक्टर कहा जाता है, और प्रशिक्षण डेटा को एक मैट्रिक्स द्वारा दर्शाया जाता है । एक उद्देश्य फ़ंक्शन के पुनरावृत्त अनुकूलन के माध्यम से , पर्यवेक्षित शिक्षण एल्गोरिदम एक फ़ंक्शन सीखते हैं जिसका उपयोग नए इनपुट से जुड़े आउटपुट की भविष्यवाणी करने के लिए किया जा सकता है। [३९] एक इष्टतम फ़ंक्शन एल्गोरिदम को इनपुट के आउटपुट को सही ढंग से निर्धारित करने की अनुमति देगा जो प्रशिक्षण डेटा का हिस्सा नहीं थे। एक एल्गोरिथ्म जो समय के साथ अपने आउटपुट या भविष्यवाणियों की सटीकता में सुधार करता है, कहा जाता है कि उसने उस कार्य को करना सीख लिया है। [13]
पर्यवेक्षित शिक्षण एल्गोरिदम के प्रकारों में सक्रिय शिक्षण , वर्गीकरण और प्रतिगमन शामिल हैं । [४०] वर्गीकरण एल्गोरिदम का उपयोग तब किया जाता है जब आउटपुट सीमित मानों तक सीमित होते हैं, और रिग्रेशन एल्गोरिदम का उपयोग तब किया जाता है जब आउटपुट का एक सीमा के भीतर कोई संख्यात्मक मान हो सकता है। एक उदाहरण के रूप में, एक वर्गीकरण एल्गोरिथ्म के लिए जो ईमेल को फ़िल्टर करता है, इनपुट एक आने वाला ईमेल होगा, और आउटपुट उस फ़ोल्डर का नाम होगा जिसमें ईमेल दर्ज करना है।
समानता सीखना पर्यवेक्षित मशीन सीखने का एक क्षेत्र है जो प्रतिगमन और वर्गीकरण से निकटता से संबंधित है, लेकिन लक्ष्य समानता फ़ंक्शन का उपयोग करके उदाहरणों से सीखना है जो मापता है कि समान या संबंधित दो वस्तुएं कैसे हैं। इसमें रैंकिंग , अनुशंसा प्रणाली , दृश्य पहचान ट्रैकिंग, चेहरा सत्यापन और स्पीकर सत्यापन में अनुप्रयोग हैं ।
अनुपयोगी शिक्षा
अनुपयोगी शिक्षण एल्गोरिदम डेटा का एक सेट लेते हैं जिसमें केवल इनपुट होते हैं, और डेटा में संरचना ढूंढते हैं, जैसे डेटा बिंदुओं का समूहीकरण या क्लस्टरिंग। इसलिए, एल्गोरिदम परीक्षण डेटा से सीखते हैं जिसे लेबल, वर्गीकृत या वर्गीकृत नहीं किया गया है। प्रतिक्रिया का जवाब देने के बजाय, अप्रशिक्षित शिक्षण एल्गोरिदम डेटा में समानताओं की पहचान करते हैं और डेटा के प्रत्येक नए टुकड़े में ऐसी समानताओं की उपस्थिति या अनुपस्थिति के आधार पर प्रतिक्रिया करते हैं। गैर-पर्यवेक्षित शिक्षण का एक केंद्रीय अनुप्रयोग आँकड़ों में घनत्व अनुमान के क्षेत्र में है , जैसे कि संभाव्यता घनत्व फ़ंक्शन का पता लगाना । [४१] हालांकि असुरक्षित शिक्षण में अन्य डोमेन शामिल हैं जिनमें डेटा विशेषताओं को सारांशित करना और उनकी व्याख्या करना शामिल है।
क्लस्टर विश्लेषण सबसेट ( क्लस्टर कहा जाता है ) में अवलोकनों के एक सेट का असाइनमेंट है ताकि एक ही क्लस्टर के भीतर अवलोकन एक या अधिक पूर्वनिर्धारित मानदंडों के अनुसार समान हों, जबकि विभिन्न समूहों से प्राप्त अवलोकन भिन्न हों। विभिन्न क्लस्टरिंग तकनीक डेटा की संरचना पर अलग-अलग धारणाएं बनाती हैं, जिन्हें अक्सर कुछ समानता मीट्रिक द्वारा परिभाषित किया जाता है और मूल्यांकन किया जाता है, उदाहरण के लिए, आंतरिक कॉम्पैक्टनेस , या एक ही क्लस्टर के सदस्यों के बीच समानता, और अलगाव , क्लस्टर के बीच का अंतर। अन्य विधियां अनुमानित घनत्व और ग्राफ कनेक्टिविटी पर आधारित हैं ।
अर्ध पर्यवेक्षित शिक्षण
अर्ध-पर्यवेक्षित शिक्षण अनपर्यवेक्षित शिक्षण (बिना किसी लेबल प्रशिक्षण डेटा के) और पर्यवेक्षित शिक्षण (पूरी तरह से लेबल किए गए प्रशिक्षण डेटा के साथ) के बीच आता है। कुछ प्रशिक्षण उदाहरणों में प्रशिक्षण लेबल गायब हैं, फिर भी कई मशीन-लर्निंग शोधकर्ताओं ने पाया है कि लेबल रहित डेटा, जब लेबल किए गए डेटा की एक छोटी मात्रा के संयोजन के साथ प्रयोग किया जाता है, तो सीखने की सटीकता में काफी सुधार हो सकता है।
में कमजोर देखरेख सीखने , प्रशिक्षण लेबल शोर है, सीमित, या अनिश्चित हैं; हालांकि, इन लेबलों को प्राप्त करना अक्सर सस्ता होता है, जिसके परिणामस्वरूप बड़े प्रभावी प्रशिक्षण सेट प्राप्त होते हैं। [42]
सुदृढीकरण सीखना
रीइन्फोर्समेंट लर्निंग मशीन लर्निंग का एक क्षेत्र है, जो इस बात से संबंधित है कि कैसे सॉफ्टवेयर एजेंटों को पर्यावरण में कार्रवाई करनी चाहिए ताकि संचयी इनाम की कुछ धारणा को अधिकतम किया जा सके। इसकी व्यापकता के कारण, खेल सिद्धांत , नियंत्रण सिद्धांत , संचालन अनुसंधान , सूचना सिद्धांत , सिमुलेशन-आधारित अनुकूलन , बहु-एजेंट सिस्टम , झुंड खुफिया , सांख्यिकी और आनुवंशिक एल्गोरिदम जैसे कई अन्य विषयों में क्षेत्र का अध्ययन किया जाता है । मशीन लर्निंग में, पर्यावरण को आमतौर पर मार्कोव निर्णय प्रक्रिया (एमडीपी) के रूप में दर्शाया जाता है । कई सुदृढीकरण सीखने वाले एल्गोरिदम गतिशील प्रोग्रामिंग तकनीकों का उपयोग करते हैं। [४३] रीइन्फोर्समेंट लर्निंग एल्गोरिदम एमडीपी के एक सटीक गणितीय मॉडल के ज्ञान को ग्रहण नहीं करता है, और इसका उपयोग तब किया जाता है जब सटीक मॉडल संभव नहीं होते हैं। सुदृढीकरण सीखने के एल्गोरिदम का उपयोग स्वायत्त वाहनों में या मानव प्रतिद्वंद्वी के खिलाफ खेल खेलना सीखने में किया जाता है।
आयामी कमी
आयामीता में कमी प्रमुख चर का एक सेट प्राप्त करके विचाराधीन यादृच्छिक चर की संख्या को कम करने की एक प्रक्रिया है। [४४] दूसरे शब्दों में, यह आपके फीचर सेट के आयाम को कम करने की एक प्रक्रिया है जिसे नो ऑफ फीचर्स भी कहा जाता है। अधिकांश आयामी कमी तकनीकों को या तो सुविधा उन्मूलन या निष्कर्षण के रूप में माना जा सकता है। आयामीता में कमी के लोकप्रिय तरीकों में से एक को प्रमुख घटक विश्लेषण कहा जाता है।
- प्रधान घटक विश्लेषण (पीसीए)
पीसीए में उच्च आयामी डेटा (जैसे। 3 डी) को एक छोटे स्थान (जैसे। 2 डी) में बदलना शामिल है। यह डेटा के एक छोटे आयाम में परिणाम देता है, डेटा को बदले बिना मॉडल में सभी मूल चर रखते हुए (3D के बजाय 2D)। [45]
अन्य प्रकार
अन्य दृष्टिकोण विकसित किए गए हैं जो इस तीन गुना वर्गीकरण में अच्छी तरह फिट नहीं होते हैं, और कभी-कभी एक ही मशीन लर्निंग सिस्टम द्वारा एक से अधिक का उपयोग किया जाता है। उदाहरण के लिए विषय मॉडलिंग , मेटा लर्निंग । [46]
2020 तक, मशीन लर्निंग के क्षेत्र में चल रहे काम के लिए डीप लर्निंग प्रमुख दृष्टिकोण बन गया है। [7]
स्वयं सीखना
मशीन लर्निंग प्रतिमान के रूप में सेल्फ-लर्निंग को 1982 में क्रॉसबार एडेप्टिव एरे (सीएए) नाम के सेल्फ-लर्निंग में सक्षम एक तंत्रिका नेटवर्क के साथ पेश किया गया था । [४७] यह एक ऐसी सीख है जिसमें कोई बाहरी पुरस्कार नहीं है और कोई बाहरी शिक्षक सलाह नहीं है। सीएए सेल्फ-लर्निंग एल्गोरिथम एक क्रॉसबार फैशन में, परिणाम स्थितियों के बारे में कार्यों और भावनाओं (भावनाओं) दोनों के निर्णयों की गणना करता है। प्रणाली अनुभूति और भावना के बीच बातचीत द्वारा संचालित होती है। [४८] सेल्फ-लर्निंग एल्गोरिथम मेमोरी मैट्रिक्स को अपडेट करता है W ==||w(a,s)|| जैसे कि प्रत्येक पुनरावृत्ति में निम्नलिखित मशीन लर्निंग रूटीन निष्पादित करता है:
स्थिति में कोई क्रिया करें a; परिणाम स्थिति प्राप्त करें '; परिणाम की स्थिति में होने की भावना की गणना करें v(s'); क्रॉसबार मेमोरी w'(a,s) = w(a,s) + v(s') अपडेट करें।
यह केवल एक इनपुट, स्थिति s, और केवल एक आउटपुट, क्रिया (या व्यवहार) के साथ एक प्रणाली है। न तो कोई अलग सुदृढीकरण इनपुट है और न ही पर्यावरण से कोई सलाह इनपुट। बैकप्रोपेगेटेड वैल्यू (द्वितीयक सुदृढीकरण) परिणाम की स्थिति के प्रति भावना है। सीएए दो वातावरणों में मौजूद है, एक है व्यवहार का वातावरण जहां यह व्यवहार करता है, और दूसरा आनुवंशिक वातावरण है, जहां से यह शुरू में और केवल एक बार व्यवहारिक वातावरण में आने वाली स्थितियों के बारे में प्रारंभिक भावनाओं को प्राप्त करता है। आनुवंशिक वातावरण से जीनोम (प्रजाति) वेक्टर प्राप्त करने के बाद, सीएए एक ऐसे वातावरण में लक्ष्य-प्राप्ति व्यवहार सीखता है, जिसमें वांछनीय और अवांछनीय दोनों स्थितियां होती हैं। [49]
फ़ीचर लर्निंग
कई शिक्षण एल्गोरिदम का उद्देश्य प्रशिक्षण के दौरान प्रदान किए गए इनपुट के बेहतर प्रतिनिधित्व की खोज करना है। [५०] क्लासिक उदाहरणों में प्रमुख घटक विश्लेषण और क्लस्टर विश्लेषण शामिल हैं। फ़ीचर लर्निंग एल्गोरिदम, जिसे रिप्रेजेंटेशन लर्निंग एल्गोरिदम भी कहा जाता है, अक्सर अपने इनपुट में जानकारी को संरक्षित करने का प्रयास करते हैं, लेकिन इसे इस तरह से रूपांतरित भी करते हैं जो इसे उपयोगी बनाता है, अक्सर वर्गीकरण या भविष्यवाणी करने से पहले एक पूर्व-प्रसंस्करण चरण के रूप में। यह तकनीक अज्ञात डेटा-जनरेटिंग वितरण से आने वाले इनपुट के पुनर्निर्माण की अनुमति देती है, जबकि उस वितरण के तहत असंभव कॉन्फ़िगरेशन के लिए जरूरी नहीं है। यह मैनुअल फीचर इंजीनियरिंग की जगह लेता है , और मशीन को दोनों विशेषताओं को सीखने और एक विशिष्ट कार्य करने के लिए उनका उपयोग करने की अनुमति देता है।
फ़ीचर लर्निंग या तो पर्यवेक्षित या अनुपयोगी हो सकता है। पर्यवेक्षित फीचर लर्निंग में, लेबल किए गए इनपुट डेटा का उपयोग करके सुविधाओं को सीखा जाता है। उदाहरणों में कृत्रिम तंत्रिका नेटवर्क , बहुपरत परसेप्ट्रोन और पर्यवेक्षित शब्दकोश सीखना शामिल हैं । गैर-पर्यवेक्षित फीचर लर्निंग में, बिना लेबल वाले इनपुट डेटा के साथ सुविधाओं को सीखा जाता है। उदाहरणों में डिक्शनरी लर्निंग, इंडिपेंडेंट कंपोनेंट एनालिसिस , ऑटोएन्कोडर , मैट्रिक्स फैक्टराइजेशन [51] और क्लस्टरिंग के विभिन्न रूप शामिल हैं । [५२] [५३] [५४]
मैनिफोल्ड लर्निंग एल्गोरिदम इस बाधा के तहत ऐसा करने का प्रयास करते हैं कि सीखा हुआ प्रतिनिधित्व निम्न-आयामी है। विरल कोडिंग एल्गोरिदम इस बाधा के तहत ऐसा करने का प्रयास करते हैं कि सीखा प्रतिनिधित्व विरल है, जिसका अर्थ है कि गणितीय मॉडल में कई शून्य हैं। मल्टीलाइनियर सबस्पेस लर्निंग एल्गोरिदम का उद्देश्य उच्च-आयामी वैक्टर में उन्हें दोबारा बदलने के बिना, बहुआयामी डेटा के लिए सीधे टेंसर प्रतिनिधित्व से निम्न-आयामी प्रतिनिधित्व सीखना है । [५५] डीप लर्निंग एल्गोरिदम निम्न-स्तरीय सुविधाओं के संदर्भ में (या उत्पन्न) उच्च-स्तरीय, अधिक अमूर्त विशेषताओं के साथ प्रतिनिधित्व के कई स्तरों, या सुविधाओं के पदानुक्रम की खोज करते हैं। यह तर्क दिया गया है कि एक बुद्धिमान मशीन वह है जो एक प्रतिनिधित्व सीखती है जो भिन्नता के अंतर्निहित कारकों को अलग करती है जो देखे गए डेटा की व्याख्या करते हैं। [56]
फ़ीचर लर्निंग इस तथ्य से प्रेरित है कि वर्गीकरण जैसे मशीन लर्निंग कार्यों में अक्सर ऐसे इनपुट की आवश्यकता होती है जो गणितीय और कम्प्यूटेशनल रूप से प्रक्रिया के लिए सुविधाजनक हो। हालांकि, वास्तविक दुनिया के डेटा जैसे कि चित्र, वीडियो और संवेदी डेटा विशिष्ट विशेषताओं को एल्गोरिथम रूप से परिभाषित करने के प्रयासों में नहीं आए हैं। एक विकल्प स्पष्ट एल्गोरिदम पर भरोसा किए बिना, परीक्षा के माध्यम से ऐसी विशेषताओं या अभ्यावेदन की खोज करना है।
विरल शब्दकोश सीखना
विरल डिक्शनरी लर्निंग एक फीचर लर्निंग विधि है जहां एक प्रशिक्षण उदाहरण को आधार कार्यों के रैखिक संयोजन के रूप में दर्शाया जाता है , और इसे एक विरल मैट्रिक्स माना जाता है । विधि दृढ़ता से एनपी-कठिन है और लगभग हल करना मुश्किल है। [५७] विरल शब्दकोश सीखने के लिए एक लोकप्रिय अनुमानी विधि K-SVD एल्गोरिथम है। विरल शब्दकोश सीखने को कई संदर्भों में लागू किया गया है। वर्गीकरण में, समस्या उस वर्ग को निर्धारित करने की है जिससे पहले अनदेखी प्रशिक्षण उदाहरण संबंधित है। एक शब्दकोश के लिए जहां प्रत्येक वर्ग पहले ही बनाया जा चुका है, एक नया प्रशिक्षण उदाहरण उस वर्ग से जुड़ा होता है जिसे संबंधित शब्दकोश द्वारा सबसे अच्छा रूप से दर्शाया जाता है। विरल डिक्शनरी लर्निंग को इमेज डी-नॉइज़िंग में भी लागू किया गया है । मुख्य विचार यह है कि एक साफ छवि पैच को एक छवि शब्दकोश द्वारा बहुत कम दर्शाया जा सकता है, लेकिन शोर नहीं कर सकता। [58]
असंगति का पता लगाये
में डाटा माइनिंग , विसंगति का पता लगाने, भी बाहरी का पता लगाने के रूप में जाना जाता है, दुर्लभ वस्तुओं, घटनाओं या टिप्पणियों जो डेटा के बहुमत से काफी भिन्न द्वारा संदेह उठाने की पहचान है। [५९] आम तौर पर, विषम वस्तुएं बैंक धोखाधड़ी , एक संरचनात्मक दोष, चिकित्सा समस्याओं या पाठ में त्रुटियों जैसे मुद्दों का प्रतिनिधित्व करती हैं। विसंगतियों को बाहरी , नवीनता, शोर, विचलन और अपवाद के रूप में जाना जाता है। [60]
विशेष रूप से, दुरुपयोग और नेटवर्क घुसपैठ का पता लगाने के संदर्भ में, दिलचस्प वस्तुएं अक्सर दुर्लभ वस्तुएं नहीं होती हैं, लेकिन निष्क्रियता के अप्रत्याशित विस्फोट होते हैं। यह पैटर्न एक दुर्लभ वस्तु के रूप में एक बाहरी की सामान्य सांख्यिकीय परिभाषा का पालन नहीं करता है, और कई बाहरी पता लगाने के तरीके (विशेष रूप से, असुरक्षित एल्गोरिदम) ऐसे डेटा पर विफल हो जाएंगे जब तक कि इसे उचित रूप से एकत्र नहीं किया गया हो। इसके बजाय, एक क्लस्टर विश्लेषण एल्गोरिथ्म इन पैटर्नों द्वारा गठित सूक्ष्म समूहों का पता लगाने में सक्षम हो सकता है। [61]
विसंगति का पता लगाने वाली तकनीकों की तीन व्यापक श्रेणियां मौजूद हैं। [६२] गैर-पर्यवेक्षित विसंगति का पता लगाने की तकनीक एक गैर-लेबल परीक्षण डेटा सेट में विसंगतियों का पता लगाती है, इस धारणा के तहत कि डेटा सेट में अधिकांश उदाहरण सामान्य हैं, ऐसे उदाहरणों की तलाश में जो शेष डेटा सेट के लिए कम से कम फिट होते हैं। पर्यवेक्षित विसंगति का पता लगाने की तकनीकों के लिए एक डेटा सेट की आवश्यकता होती है जिसे "सामान्य" और "असामान्य" के रूप में लेबल किया गया है और इसमें एक क्लासिफायरियर का प्रशिक्षण शामिल है (कई अन्य सांख्यिकीय वर्गीकरण समस्याओं के लिए महत्वपूर्ण अंतर बाहरी पहचान की स्वाभाविक रूप से असंतुलित प्रकृति है)। अर्ध-पर्यवेक्षित विसंगति का पता लगाने की तकनीक किसी दिए गए सामान्य प्रशिक्षण डेटा सेट से सामान्य व्यवहार का प्रतिनिधित्व करने वाले मॉडल का निर्माण करती है और फिर मॉडल द्वारा उत्पन्न होने वाले परीक्षण उदाहरण की संभावना का परीक्षण करती है।
रोबोट सीखना
में विकास रोबोटिक्स , रोबोट सीखने एल्गोरिदम अनुभवों, यह भी एक पाठ्यक्रम के रूप में जाना सीखने, संचयी आत्म निर्देशित अन्वेषण और मनुष्यों के साथ सामाजिक संपर्क के माध्यम से नए कौशल प्राप्त करने के लिए अपने स्वयं के दृश्यों उत्पन्न करते हैं। ये रोबोट सक्रिय शिक्षण, परिपक्वता, मोटर तालमेल और अनुकरण जैसे मार्गदर्शन तंत्र का उपयोग करते हैं ।
संघ के नियम
एसोसिएशन नियम सीखना बड़े डेटाबेस में चर के बीच संबंधों की खोज के लिए एक नियम-आधारित मशीन सीखने की विधि है। इसका उद्देश्य "दिलचस्पता" के कुछ उपायों का उपयोग करके डेटाबेस में खोजे गए मजबूत नियमों की पहचान करना है। [63]
नियम-आधारित मशीन लर्निंग किसी भी मशीन लर्निंग विधि के लिए एक सामान्य शब्द है जो ज्ञान को संग्रहीत करने, हेरफेर करने या लागू करने के लिए "नियम" की पहचान करता है, सीखता है या विकसित करता है। नियम-आधारित मशीन लर्निंग एल्गोरिदम की परिभाषित विशेषता संबंधपरक नियमों के एक सेट की पहचान और उपयोग है जो सामूहिक रूप से सिस्टम द्वारा प्राप्त ज्ञान का प्रतिनिधित्व करते हैं। यह अन्य मशीन लर्निंग एल्गोरिदम के विपरीत है जो आमतौर पर एक विलक्षण मॉडल की पहचान करता है जिसे भविष्यवाणी करने के लिए किसी भी उदाहरण पर सार्वभौमिक रूप से लागू किया जा सकता है। [६४] नियम-आधारित मशीन लर्निंग दृष्टिकोण में लर्निंग क्लासिफायर सिस्टम , एसोसिएशन रूल लर्निंग और कृत्रिम प्रतिरक्षा प्रणाली शामिल हैं ।
मजबूत नियमों की अवधारणा के आधार पर, राकेश अग्रवाल , टॉमस इमिलिंस्की और अरुण स्वामी ने सुपरमार्केट में पॉइंट-ऑफ-सेल (पीओएस) सिस्टम द्वारा रिकॉर्ड किए गए बड़े पैमाने पर लेनदेन डेटा में उत्पादों के बीच नियमितता की खोज के लिए एसोसिएशन नियम पेश किए । [६५] उदाहरण के लिए, नियमएक सुपरमार्केट के बिक्री आंकड़ों में पाया गया है कि अगर कोई ग्राहक प्याज और आलू एक साथ खरीदता है, तो वे हैमबर्गर मांस भी खरीद सकते हैं। ऐसी जानकारी का उपयोग प्रचारात्मक मूल्य निर्धारण या उत्पाद प्लेसमेंट जैसी मार्केटिंग गतिविधियों के बारे में निर्णय लेने के लिए आधार के रूप में किया जा सकता है । बाजार टोकरी विश्लेषण के अलावा , वेब उपयोग खनन , घुसपैठ का पता लगाने , निरंतर उत्पादन , और जैव सूचना विज्ञान सहित अनुप्रयोग क्षेत्रों में एसोसिएशन नियम आज कार्यरत हैं । सीक्वेंस माइनिंग के विपरीत , एसोसिएशन रूल लर्निंग आमतौर पर लेन-देन के भीतर या पूरे लेन-देन में वस्तुओं के क्रम पर विचार नहीं करता है।
लर्निंग क्लासिफायर सिस्टम (LCS) नियम-आधारित मशीन लर्निंग एल्गोरिदम का एक परिवार है जो एक खोज घटक को जोड़ता है, आमतौर पर एक आनुवंशिक एल्गोरिथम , एक सीखने के घटक के साथ, पर्यवेक्षित शिक्षण , सुदृढीकरण सीखने , या अनुपयोगी शिक्षण का प्रदर्शन करता है । वे संदर्भ-निर्भर नियमों के एक समूह की पहचान करना चाहते हैं जो भविष्यवाणियां करने के लिए सामूहिक रूप से ज्ञान को टुकड़ों में संग्रहीत और लागू करते हैं । [66]
आगमनात्मक तर्क प्रोग्रामिंग (ILP) इनपुट उदाहरणों, पृष्ठभूमि ज्ञान और परिकल्पनाओं के लिए एक समान प्रतिनिधित्व के रूप में तर्क प्रोग्रामिंग का उपयोग करके नियम-सीखने का एक दृष्टिकोण है। जाना जाता पृष्ठभूमि ज्ञान और तथ्यों के एक तार्किक डेटाबेस के रूप में प्रतिनिधित्व उदाहरण के एक सेट का एक एन्कोडिंग को देखते हुए, एक आईएलपी प्रणाली एक परिकल्पना दी तर्क प्रोग्राम है जो प्राप्त होगा जरूरत पर जोर देता सभी सकारात्मक और कोई नकारात्मक उदाहरण। आगमनात्मक प्रोग्रामिंग एक संबंधित क्षेत्र है जो परिकल्पना (और न केवल तर्क प्रोग्रामिंग) का प्रतिनिधित्व करने के लिए किसी भी प्रकार की प्रोग्रामिंग भाषा पर विचार करता है, जैसे कार्यात्मक कार्यक्रम ।
आगमनात्मक तर्क प्रोग्रामिंग जैव सूचना विज्ञान और प्राकृतिक भाषा प्रसंस्करण में विशेष रूप से उपयोगी है । गॉर्डन प्लॉटकिन और एहुद शापिरो ने तार्किक सेटिंग में आगमनात्मक मशीन सीखने के लिए प्रारंभिक सैद्धांतिक नींव रखी। [६७] [६८] [६९] शापिरो ने १९८१ में अपना पहला कार्यान्वयन (मॉडल इंफरेंस सिस्टम) बनाया: एक प्रोलॉग प्रोग्राम जो सकारात्मक और नकारात्मक उदाहरणों से तर्क कार्यक्रमों का अनुमान लगाता है। [७०] यहां आगमनात्मक शब्द दार्शनिक प्रेरण को संदर्भित करता है , जो गणितीय प्रेरण के बजाय प्रेक्षित तथ्यों की व्याख्या करने के लिए एक सिद्धांत का सुझाव देता है, जो एक सुव्यवस्थित सेट के सभी सदस्यों के लिए एक संपत्ति साबित करता है।
मॉडल
प्रदर्शन मशीन लर्निंग में एक मॉडल बनाना शामिल है , जिसे कुछ प्रशिक्षण डेटा पर प्रशिक्षित किया जाता है और फिर भविष्यवाणियां करने के लिए अतिरिक्त डेटा को संसाधित कर सकता है। मशीन लर्निंग सिस्टम के लिए विभिन्न प्रकार के मॉडलों का उपयोग और शोध किया गया है।
कृत्रिम तंत्रिका प्रसार

कृत्रिम तंत्रिका नेटवर्क (ANNs), या connectionist प्रणाली, कंप्यूटिंग प्रणालियों अस्पष्ट से प्रेरित हैं जैविक तंत्रिका नेटवर्क है कि पशु का गठन दिमाग । ऐसी प्रणालियाँ उदाहरणों पर विचार करके कार्य करना "सीखती हैं", आमतौर पर किसी कार्य-विशिष्ट नियमों के साथ प्रोग्राम किए बिना।
एक एएनएन एक मॉडल है जो " कृत्रिम न्यूरॉन्स " नामक कनेक्टेड इकाइयों या नोड्स के संग्रह पर आधारित है , जो जैविक मस्तिष्क में न्यूरॉन्स को शिथिल रूप से मॉडल करता है । जैविक मस्तिष्क में सिनेप्स की तरह प्रत्येक कनेक्शन, एक कृत्रिम न्यूरॉन से दूसरे में सूचना, एक "संकेत" संचारित कर सकता है। एक कृत्रिम न्यूरॉन जो एक संकेत प्राप्त करता है, इसे संसाधित कर सकता है और फिर इससे जुड़े अतिरिक्त कृत्रिम न्यूरॉन्स को संकेत दे सकता है। सामान्य एएनएन कार्यान्वयन में, कृत्रिम न्यूरॉन्स के बीच एक कनेक्शन पर संकेत एक वास्तविक संख्या है , और प्रत्येक कृत्रिम न्यूरॉन के आउटपुट की गणना इसके इनपुट के योग के कुछ गैर-रेखीय फ़ंक्शन द्वारा की जाती है। कृत्रिम न्यूरॉन्स के बीच के कनेक्शन को "किनारों" कहा जाता है। कृत्रिम न्यूरॉन्स और किनारों में आमतौर पर एक वजन होता है जो सीखने की आय के रूप में समायोजित होता है। वजन एक कनेक्शन पर सिग्नल की ताकत को बढ़ाता या घटाता है। कृत्रिम न्यूरॉन्स में एक थ्रेशोल्ड हो सकता है जैसे कि सिग्नल केवल तभी भेजा जाता है जब कुल सिग्नल उस थ्रेशोल्ड को पार करता है। आमतौर पर, कृत्रिम न्यूरॉन्स परतों में एकत्रित होते हैं। विभिन्न परतें अपने इनपुट पर विभिन्न प्रकार के परिवर्तन कर सकती हैं। सिग्नल पहली परत (इनपुट परत) से अंतिम परत (आउटपुट परत) तक जाते हैं, संभवतः परतों को कई बार पार करने के बाद।
एएनएन दृष्टिकोण का मूल लक्ष्य समस्याओं को उसी तरह हल करना था जैसे मानव मस्तिष्क करता है । हालांकि, समय के साथ, ध्यान विशिष्ट कार्यों को करने के लिए चला गया, जिससे जीव विज्ञान से विचलन हो गया । कृत्रिम तंत्रिका नेटवर्क का उपयोग कंप्यूटर दृष्टि , भाषण पहचान , मशीन अनुवाद , सोशल नेटवर्क फ़िल्टरिंग, प्लेइंग बोर्ड और वीडियो गेम और चिकित्सा निदान सहित विभिन्न कार्यों पर किया गया है ।
डीप लर्निंग में कृत्रिम तंत्रिका नेटवर्क में कई छिपी हुई परतें होती हैं। यह दृष्टिकोण मानव मस्तिष्क द्वारा प्रकाश और ध्वनि को दृष्टि और श्रवण में संसाधित करने के तरीके को मॉडल करने का प्रयास करता है। डीप लर्निंग के कुछ सफल अनुप्रयोग कंप्यूटर विज़न और स्पीच रिकग्निशन हैं । [71]
निर्णय के पेड़
डिसीजन ट्री लर्निंग एक आइटम के बारे में टिप्पणियों (शाखाओं में प्रतिनिधित्व) से आइटम के लक्ष्य मूल्य (पत्तियों में प्रतिनिधित्व) के बारे में निष्कर्ष तक जाने के लिए एक भविष्य कहनेवाला मॉडल के रूप में एक निर्णय ट्री का उपयोग करता है । यह सांख्यिकी, डेटा माइनिंग और मशीन लर्निंग में उपयोग किए जाने वाले भविष्य कहनेवाला मॉडलिंग दृष्टिकोणों में से एक है। ट्री मॉडल जहां लक्ष्य चर मानों का असतत सेट ले सकता है, वर्गीकरण ट्री कहलाते हैं; इन वृक्ष संरचनाओं में, पत्तियां वर्ग लेबल का प्रतिनिधित्व करती हैं और शाखाएं उन विशेषताओं के संयोजन का प्रतिनिधित्व करती हैं जो उन वर्ग लेबलों की ओर ले जाती हैं। निर्णय वृक्ष जहां लक्ष्य चर निरंतर मान (आमतौर पर वास्तविक संख्या ) ले सकते हैं, प्रतिगमन वृक्ष कहलाते हैं। निर्णय विश्लेषण में, निर्णय वृक्ष का उपयोग निर्णयों और निर्णय लेने की दृष्टि से और स्पष्ट रूप से प्रतिनिधित्व करने के लिए किया जा सकता है । डेटा माइनिंग में, एक निर्णय वृक्ष डेटा का वर्णन करता है, लेकिन परिणामी वर्गीकरण वृक्ष निर्णय लेने के लिए एक इनपुट हो सकता है।
समर्थन वेक्टर मशीन
सपोर्ट-वेक्टर मशीन (एसवीएम), जिसे सपोर्ट-वेक्टर नेटवर्क के रूप में भी जाना जाता है, वर्गीकरण और प्रतिगमन के लिए उपयोग की जाने वाली संबंधित पर्यवेक्षित शिक्षण विधियों का एक समूह है । प्रशिक्षण उदाहरणों के एक सेट को देखते हुए, प्रत्येक को दो श्रेणियों में से एक के रूप में चिह्नित किया गया है, एक एसवीएम प्रशिक्षण एल्गोरिदम एक मॉडल बनाता है जो भविष्यवाणी करता है कि कोई नया उदाहरण एक श्रेणी या दूसरे में आता है या नहीं। [७२] एक एसवीएम प्रशिक्षण एल्गोरिथ्म एक गैर- संभाव्य , द्विआधारी , रैखिक क्लासिफायरियर है , हालांकि एक संभाव्य वर्गीकरण सेटिंग में एसवीएम का उपयोग करने के लिए प्लैट स्केलिंग जैसी विधियां मौजूद हैं। रैखिक वर्गीकरण करने के अलावा, एसवीएम कुशलता से एक गैर-रेखीय वर्गीकरण का प्रदर्शन कर सकते हैं जिसे कर्नेल ट्रिक कहा जाता है, जो उनके इनपुट को उच्च-आयामी फीचर स्पेस में परोक्ष रूप से मैप करता है।

प्रतिगमन विश्लेषण
प्रतिगमन विश्लेषण में इनपुट चर और उनकी संबद्ध विशेषताओं के बीच संबंध का अनुमान लगाने के लिए सांख्यिकीय विधियों की एक विशाल विविधता शामिल है। इसका सबसे सामान्य रूप रेखीय प्रतिगमन है , जहां दिए गए डेटा को सामान्य न्यूनतम वर्ग जैसे गणितीय मानदंड के अनुसार सर्वोत्तम रूप से फिट करने के लिए एक एकल रेखा खींची जाती है । रिज रिग्रेशन के रूप में, ओवरफिटिंग और पूर्वाग्रह को कम करने के लिए उत्तरार्द्ध को अक्सर नियमितीकरण (गणित) विधियों द्वारा बढ़ाया जाता है । गैर-रेखीय समस्याओं से निपटने के दौरान, गो-टू मॉडल में बहुपद प्रतिगमन (उदाहरण के लिए, माइक्रोसॉफ्ट एक्सेल [73] में ट्रेंडलाइन फिटिंग के लिए उपयोग किया जाता है ), लॉजिस्टिक रिग्रेशन (अक्सर सांख्यिकीय वर्गीकरण में उपयोग किया जाता है ) या यहां तक कि कर्नेल रिग्रेशन भी शामिल है , जो गैर-रैखिकता का परिचय देता है। कर्नेल ट्रिक का लाभ उठाकर इनपुट चर को उच्च-आयामी स्थान पर परोक्ष रूप से मैप करने के लिए।
बायेसियन नेटवर्क

एक बायेसियन नेटवर्क, विश्वास नेटवर्क, या निर्देशित एसाइक्लिक ग्राफिकल मॉडल एक संभाव्य ग्राफिकल मॉडल है जो एक निर्देशित एसाइक्लिक ग्राफ (डीएजी) के साथ यादृच्छिक चर और उनकी सशर्त स्वतंत्रता के एक सेट का प्रतिनिधित्व करता है । उदाहरण के लिए, बायेसियन नेटवर्क रोगों और लक्षणों के बीच संभाव्य संबंधों का प्रतिनिधित्व कर सकता है। लक्षणों को देखते हुए, विभिन्न रोगों की उपस्थिति की संभावनाओं की गणना के लिए नेटवर्क का उपयोग किया जा सकता है। कुशल एल्गोरिदम मौजूद हैं जो अनुमान और सीखने का प्रदर्शन करते हैं । बायेसियन नेटवर्क जो चर के अनुक्रमों को मॉडल करते हैं, जैसे भाषण संकेत या प्रोटीन अनुक्रम , गतिशील बायेसियन नेटवर्क कहलाते हैं । बायेसियन नेटवर्क के सामान्यीकरण जो अनिश्चितता के तहत निर्णय समस्याओं का प्रतिनिधित्व और समाधान कर सकते हैं उन्हें प्रभाव आरेख कहा जाता है ।
आनुवंशिक एल्गोरिदम
एक आनुवंशिक एल्गोरिथम (जीए) एक खोज एल्गोरिथ्म और अनुमानी तकनीक है जो प्राकृतिक चयन की प्रक्रिया की नकल करता है , किसी समस्या के अच्छे समाधान खोजने की उम्मीद में नए जीनोटाइप उत्पन्न करने के लिए उत्परिवर्तन और क्रॉसओवर जैसे तरीकों का उपयोग करता है। मशीन लर्निंग में, 1980 और 1990 के दशक में जेनेटिक एल्गोरिदम का इस्तेमाल किया गया था। [७४] [७५] इसके विपरीत, आनुवंशिक और विकासवादी एल्गोरिदम के प्रदर्शन को बेहतर बनाने के लिए मशीन लर्निंग तकनीकों का उपयोग किया गया है । [76]
प्रशिक्षण मॉडल
आमतौर पर, मशीन लर्निंग मॉडल को अच्छा प्रदर्शन करने के लिए बहुत अधिक डेटा की आवश्यकता होती है। आमतौर पर, मशीन लर्निंग मॉडल को प्रशिक्षित करते समय, किसी को प्रशिक्षण सेट से डेटा का एक बड़ा, प्रतिनिधि नमूना एकत्र करने की आवश्यकता होती है। प्रशिक्षण सेट से डेटा पाठ के एक संग्रह, छवियों के संग्रह और किसी सेवा के अलग-अलग उपयोगकर्ताओं से एकत्र किए गए डेटा के रूप में विविध हो सकता है। मशीन लर्निंग मॉडल को प्रशिक्षित करते समय ओवरफिटिंग पर ध्यान देना चाहिए। पक्षपाती डेटा से प्राप्त प्रशिक्षित मॉडल के परिणामस्वरूप विषम या अवांछित भविष्यवाणियां हो सकती हैं। एल्गोरिथम पूर्वाग्रह प्रशिक्षण के लिए पूरी तरह से तैयार नहीं किए गए डेटा का एक संभावित परिणाम है।
फ़ेडरेटेड लर्निंग
फ़ेडरेटेड लर्निंग मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए वितरित कृत्रिम बुद्धिमत्ता का एक अनुकूलित रूप है जो प्रशिक्षण प्रक्रिया को विकेंद्रीकृत करता है, जिससे उपयोगकर्ताओं की गोपनीयता को बनाए रखने की अनुमति मिलती है, जिससे उन्हें अपने डेटा को केंद्रीकृत सर्वर पर भेजने की आवश्यकता नहीं होती है। यह कई उपकरणों के लिए प्रशिक्षण प्रक्रिया को विकेंद्रीकृत करके दक्षता भी बढ़ाता है। उदाहरण के लिए, Google को अलग-अलग खोजों को वापस भेजे बिना , Gboard उपयोगकर्ताओं के मोबाइल फ़ोन पर खोज क्वेरी पूर्वानुमान मॉडल को प्रशिक्षित करने के लिए फ़ेडरेटेड मशीन लर्निंग का उपयोग करता है । [77]
अनुप्रयोग
मशीन लर्निंग के लिए कई एप्लिकेशन हैं, जिनमें शामिल हैं:
- कृषि
- एनाटॉमी
- अनुकूली वेबसाइट
- प्रभावी कंप्यूटिंग
- बैंकिंग
- बायोइनफॉरमैटिक्स
- ब्रेन-मशीन इंटरफेस
- रसायन विज्ञान
- नागरिक विज्ञान
- कंप्यूटर नेटवर्क
- कंप्यूटर दृष्टि
- क्रेडिट-कार्ड धोखाधड़ी का पता लगाना
- आधार सामग्री की गुणवत्ता
- डीएनए अनुक्रम वर्गीकरण
- अर्थशास्त्र
- वित्तीय बाजार विश्लेषण [78]
- सामान्य खेल खेलना
- हस्तलिपि अभिज्ञान
- सूचना की पुनर्प्राप्ति
- बीमा
- इंटरनेट धोखाधड़ी का पता लगाना
- भाषा विज्ञान
- मशीन लर्निंग कंट्रोल
- मशीन धारणा
- मशीन अनुवाद
- विपणन
- मेडिकल जांच
- प्राकृतिक भाषा प्रसंस्करण
- प्राकृतिक भाषा समझ
- ऑनलाइन विज्ञापन
- अनुकूलन
- अनुशंसा प्रणाली
- रोबोट हरकत
- खोज इंजन
- भावनाओं का विश्लेषण
- अनुक्रम खनन
- सॉफ्टवेयर इंजीनियरिंग
- वाक् पहचान
- संरचनात्मक स्वास्थ्य निगरानी
- सिंटेक्टिक पैटर्न मान्यता
- दूरसंचार
- प्रमेय सिद्ध करना
- समय श्रृंखला पूर्वानुमान
- उपयोगकर्ता व्यवहार विश्लेषण
- आचरण
2006 में, मीडिया-सेवा प्रदाता नेटफ्लिक्स ने पहली " नेटफ्लिक्स पुरस्कार " प्रतियोगिता आयोजित की ताकि उपयोगकर्ता की प्राथमिकताओं का बेहतर अनुमान लगाने और मौजूदा सिनेमैच मूवी अनुशंसा एल्गोरिथ्म की सटीकता में कम से कम 10% तक सुधार करने के लिए एक कार्यक्रम खोजा जा सके। बिग कैओस और प्रैग्मैटिक थ्योरी टीमों के सहयोग से एटी एंड टी लैब्स- रिसर्च के शोधकर्ताओं से बनी एक संयुक्त टीम ने 2009 में $ 1 मिलियन के लिए ग्रैंड पुरस्कार जीतने के लिए एक पहनावा मॉडल बनाया । [७९] पुरस्कार दिए जाने के कुछ ही समय बाद, नेटफ्लिक्स ने महसूस किया कि दर्शकों की रेटिंग उनके देखने के पैटर्न ("सब कुछ एक सिफारिश है") का सबसे अच्छा संकेतक नहीं था और उन्होंने तदनुसार अपने अनुशंसा इंजन को बदल दिया। [८०] २०१० में वॉल स्ट्रीट जर्नल ने फर्म रिबेलियन रिसर्च और वित्तीय संकट की भविष्यवाणी करने के लिए मशीन लर्निंग के उनके उपयोग के बारे में लिखा। [८१] २०१२ में, सन माइक्रोसिस्टम्स के सह-संस्थापक , विनोद खोसला ने भविष्यवाणी की थी कि अगले दो दशकों में चिकित्सा डॉक्टरों की ८०% नौकरियां स्वचालित मशीन लर्निंग मेडिकल डायग्नोस्टिक सॉफ्टवेयर के कारण खो जाएंगी। [८२] २०१४ में, यह बताया गया था कि ललित कला चित्रों का अध्ययन करने के लिए कला इतिहास के क्षेत्र में एक मशीन लर्निंग एल्गोरिदम लागू किया गया था और यह कलाकारों के बीच पहले से अपरिचित प्रभावों को प्रकट कर सकता था। [८३] 2019 में स्प्रिंगर नेचर ने मशीन लर्निंग का उपयोग करके बनाई गई पहली शोध पुस्तक प्रकाशित की। [८४] 2020 में, मशीन लर्निंग तकनीक का उपयोग निदान करने और शोधकर्ताओं को COVID-19 का इलाज विकसित करने में मदद करने के लिए किया गया था। [८५] मशीन लर्निंग को हाल ही में मानव के हरित व्यवहार की भविष्यवाणी करने के लिए लागू किया गया है। [86]
सीमाओं
हालांकि कुछ क्षेत्रों में मशीन लर्निंग परिवर्तनकारी रहा है, मशीन-लर्निंग प्रोग्राम अक्सर अपेक्षित परिणाम देने में विफल होते हैं। [८७] [८८] [८९] इसके कई कारण हैं: (उपयुक्त) डेटा की कमी, डेटा तक पहुंच की कमी, डेटा पूर्वाग्रह, गोपनीयता की समस्याएं, गलत तरीके से चुने गए कार्य और एल्गोरिदम, गलत उपकरण और लोग, संसाधनों की कमी, और मूल्यांकन की समस्याएं। [९०]
2018 में, उबर की एक सेल्फ-ड्राइविंग कार एक पैदल यात्री का पता लगाने में विफल रही, जिसकी टक्कर के बाद मौत हो गई थी। [९१] आईबीएम वाटसन प्रणाली के साथ स्वास्थ्य सेवा में मशीन लर्निंग का उपयोग करने के प्रयास वर्षों के समय और अरबों डॉलर के निवेश के बाद भी देने में विफल रहे। [92] [93]
मशीन लर्निंग का उपयोग व्यवस्थित समीक्षा से संबंधित साक्ष्य को अद्यतन करने और बायोमेडिकल साहित्य के विकास से संबंधित समीक्षकों के बढ़ते बोझ को अद्यतन करने की रणनीति के रूप में किया गया है। हालांकि प्रशिक्षण सेटों के साथ इसमें सुधार हुआ है, लेकिन यह अभी तक पर्याप्त रूप से विकसित नहीं हुआ है ताकि स्वयं निष्कर्षों के शोध के लिए आवश्यक संवेदनशीलता को सीमित किए बिना कार्यभार के बोझ को कम किया जा सके। [94]
पक्षपात
विशेष रूप से मशीन लर्निंग दृष्टिकोण विभिन्न डेटा पूर्वाग्रहों से ग्रस्त हो सकते हैं। वर्तमान ग्राहकों पर विशेष रूप से प्रशिक्षित एक मशीन लर्निंग सिस्टम नए ग्राहक समूहों की जरूरतों का अनुमान लगाने में सक्षम नहीं हो सकता है जो प्रशिक्षण डेटा में प्रतिनिधित्व नहीं करते हैं। जब मानव निर्मित डेटा पर प्रशिक्षित किया जाता है, तो मशीन लर्निंग समाज में पहले से मौजूद संवैधानिक और अचेतन पूर्वाग्रहों को लेने की संभावना है। [९५] डेटा से सीखे गए भाषा मॉडल में मानव जैसे पूर्वाग्रहों को दिखाया गया है। [९६] [९७] आपराधिक जोखिम मूल्यांकन के लिए उपयोग की जाने वाली मशीन लर्निंग सिस्टम काले लोगों के प्रति पक्षपाती पाए गए हैं। [९८] [९९] २०१५ में, Google तस्वीरें अक्सर अश्वेत लोगों को गोरिल्ला के रूप में टैग करती थीं , [१००] और २०१८ में यह अभी भी अच्छी तरह से हल नहीं हुआ था, लेकिन कथित तौर पर Google अभी भी प्रशिक्षण डेटा से सभी गोरिल्ला को हटाने के लिए समाधान का उपयोग कर रहा था, और इस प्रकार असली गोरिल्ला को बिल्कुल भी नहीं पहचान पा रहा था। [१०१] गैर-श्वेत लोगों को पहचानने के साथ इसी तरह के मुद्दे कई अन्य प्रणालियों में पाए गए हैं। [१०२] २०१६ में, माइक्रोसॉफ्ट ने एक चैटबॉट का परीक्षण किया जो ट्विटर से सीखी, और इसने जल्दी से नस्लवादी और सेक्सिस्ट भाषा को पकड़ लिया। [१०३] ऐसी चुनौतियों के कारण, मशीन लर्निंग के प्रभावी उपयोग को अन्य क्षेत्रों में अपनाने में अधिक समय लग सकता है। [१०४] मशीन लर्निंग में निष्पक्षता के लिए चिंता , यानी मशीन लर्निंग में पूर्वाग्रह को कम करना और मानव भलाई के लिए इसके उपयोग को बढ़ावा देना कृत्रिम बुद्धिमत्ता वैज्ञानिकों द्वारा तेजी से व्यक्त किया गया है, जिसमें फी-फी ली भी शामिल हैं , जो इंजीनियरों को याद दिलाते हैं कि "एआई के बारे में कुछ भी कृत्रिम नहीं है। ..यह लोगों से प्रेरित है, यह लोगों द्वारा बनाया गया है, और सबसे महत्वपूर्ण बात यह लोगों को प्रभावित करता है। यह एक शक्तिशाली उपकरण है जिसे हम अभी समझना शुरू कर रहे हैं, और यह एक गहन जिम्मेदारी है। ” [१०५]
मॉडल आकलन
मशीन लर्निंग मॉडल के वर्गीकरण को होल्डआउट विधि जैसी सटीकता अनुमान तकनीकों द्वारा मान्य किया जा सकता है , जो डेटा को प्रशिक्षण और परीक्षण सेट (पारंपरिक रूप से 2/3 प्रशिक्षण सेट और 1/3 परीक्षण सेट पदनाम) में विभाजित करता है और प्रशिक्षण मॉडल के प्रदर्शन का मूल्यांकन करता है परीक्षण सेट पर। इसकी तुलना में, K-गुना- क्रॉस-सत्यापन विधि बेतरतीब ढंग से डेटा को K सबसेट में विभाजित करती है और फिर K प्रयोगों को क्रमशः मूल्यांकन के लिए 1 सबसेट और मॉडल के प्रशिक्षण के लिए शेष K-1 सबसेट पर विचार करते हुए किया जाता है। होल्डआउट और क्रॉस-सत्यापन विधियों के अलावा, बूटस्ट्रैप , जो डेटासेट से प्रतिस्थापन के साथ नमूने n उदाहरणों का उपयोग मॉडल सटीकता का आकलन करने के लिए किया जा सकता है। [106]
समग्र सटीकता के अलावा, जांचकर्ता अक्सर संवेदनशीलता और विशिष्टता की रिपोर्ट करते हैं जिसका अर्थ क्रमशः ट्रू पॉजिटिव रेट (TPR) और ट्रू नेगेटिव रेट (TNR) होता है। इसी तरह, जांचकर्ता कभी-कभी झूठी सकारात्मक दर (FPR) के साथ-साथ झूठी नकारात्मक दर (FNR) की रिपोर्ट करते हैं। हालाँकि, ये दरें ऐसे अनुपात हैं जो अपने अंश और हर को प्रकट करने में विफल रहते हैं। कुल प्रचालन विशेषता (टीओसी) एक मॉडल के निदान की क्षमता व्यक्त करने के लिए एक प्रभावी तरीका है। टीओसी पहले उल्लिखित दरों के अंश और हर दिखाता है, इस प्रकार टीओसी वक्र (एयूसी) के तहत आमतौर पर इस्तेमाल किए जाने वाले रिसीवर ऑपरेटिंग विशेषता (आरओसी) और आरओसी के संबद्ध क्षेत्र की तुलना में अधिक जानकारी प्रदान करता है । [107]
आचार विचार
मशीन लर्निंग कई नैतिक प्रश्नों को प्रस्तुत करता है । सिस्टम जो पूर्वाग्रह के साथ एकत्र किए गए डेटासेट पर प्रशिक्षित होते हैं, इन पूर्वाग्रहों को उपयोग ( एल्गोरिदमिक पूर्वाग्रह ) पर प्रदर्शित कर सकते हैं , इस प्रकार सांस्कृतिक पूर्वाग्रहों को डिजिटाइज़ कर सकते हैं। [१०८] उदाहरण के लिए, १९८८ में, यूके के नस्लीय समानता आयोग ने पाया कि सेंट जॉर्ज मेडिकल स्कूल पिछले प्रवेश कर्मचारियों के डेटा से प्रशिक्षित एक कंप्यूटर प्रोग्राम का उपयोग कर रहा था और इस कार्यक्रम ने लगभग ६० उम्मीदवारों को अस्वीकार कर दिया था जो या तो महिला थे। या गैर-यूरोपीय लगने वाले नाम थे। [९५] नस्लवादी भर्ती नीतियों वाली एक फर्म से नौकरी पर रखने वाले डेटा का उपयोग करने से मशीन सीखने की प्रणाली हो सकती है, जो पिछले सफल आवेदकों की समानता के आधार पर नौकरी के आवेदकों को स्कोर करके पूर्वाग्रह को दोहराती है। [१०९] [११०] एक सिस्टम द्वारा उपयोग किए जाने वाले एल्गोरिथम नियमों के डेटा और प्रलेखन का जिम्मेदार संग्रह इस प्रकार मशीन लर्निंग का एक महत्वपूर्ण हिस्सा है।
एआई तकनीकी क्षेत्रों में निर्णय लेने के लिए अच्छी तरह से सुसज्जित हो सकता है, जो डेटा और ऐतिहासिक जानकारी पर बहुत अधिक निर्भर करता है। ये निर्णय निष्पक्षता और तार्किक तर्क पर निर्भर करते हैं। [१११] क्योंकि मानव भाषाओं में पूर्वाग्रह होते हैं, भाषा निगम पर प्रशिक्षित मशीनें भी अनिवार्य रूप से इन पूर्वाग्रहों को सीख लेंगी। [११२] [११३]
अन्य प्रकार की नैतिक चुनौतियां, जो व्यक्तिगत पूर्वाग्रहों से संबंधित नहीं हैं, स्वास्थ्य देखभाल में देखी जाती हैं। स्वास्थ्य देखभाल पेशेवरों के बीच चिंता है कि इन प्रणालियों को जनता के हित में नहीं बल्कि आय पैदा करने वाली मशीनों के रूप में डिजाइन किया जा सकता है। [११४] यह संयुक्त राज्य अमेरिका में विशेष रूप से सच है जहां स्वास्थ्य देखभाल में सुधार के लिए लंबे समय से नैतिक दुविधा है, लेकिन मुनाफे में भी वृद्धि हुई है। उदाहरण के लिए, एल्गोरिदम को रोगियों को अनावश्यक परीक्षण या दवा प्रदान करने के लिए डिज़ाइन किया जा सकता है जिसमें एल्गोरिथम के मालिकाना मालिक दांव लगाते हैं। स्वास्थ्य देखभाल में मशीन सीखने की क्षमता है, जो पेशेवरों को रोगियों के लिए निदान, दवा और योजना पुनर्प्राप्ति पथ प्रदान करने के लिए एक अतिरिक्त उपकरण प्रदान करती है, लेकिन इसके लिए इन पूर्वाग्रहों को कम करने की आवश्यकता होती है। [११५]
हार्डवेयर
2010 के दशक से, मशीन लर्निंग एल्गोरिदम और कंप्यूटर हार्डवेयर दोनों में प्रगति ने गहरे तंत्रिका नेटवर्क (मशीन सीखने का एक विशेष संकीर्ण उपडोमेन) के प्रशिक्षण के लिए अधिक कुशल तरीकों का नेतृत्व किया है जिसमें गैर-रैखिक छिपी इकाइयों की कई परतें होती हैं। [११६] २०१९ तक, ग्राफिक प्रोसेसिंग यूनिट ( जीपीयू ), अक्सर एआई-विशिष्ट संवर्द्धन के साथ, बड़े पैमाने पर वाणिज्यिक क्लाउड एआई के प्रशिक्षण के प्रमुख तरीके के रूप में सीपीयू को विस्थापित कर दिया था। [११७] ओपनएआई ने एलेक्सनेट (२०१२) से अल्फाज़ेरो (२०१७) तक की सबसे बड़ी गहन शिक्षण परियोजनाओं में प्रयुक्त हार्डवेयर गणना का अनुमान लगाया, और ३.४ महीने की दोहरीकरण-समय की प्रवृत्ति के साथ आवश्यक गणना की मात्रा में ३००,००० गुना वृद्धि पाई। [११८] [११९]
सॉफ्टवेयर
विभिन्न प्रकार के मशीन लर्निंग एल्गोरिदम वाले सॉफ़्टवेयर सूट में निम्नलिखित शामिल हैं:
फ्री और ओपन सोर्स सॉफ्टवेयर
- Caffè
- सीएनटीके
- डीप लर्निंग4j
- डीप स्पीड
- एल्कि
- Infer.NET
- केरासो
- लाइटजीबीएम
- महौत
- लकड़ी का हथौड़ा
- एमएल.नेट
- एमएलपैक
- एमएक्सनेट
- तंत्रिका प्रयोगशाला
- ओपनएनएन
- संतरा
- पांडा (सॉफ्टवेयर)
- पाइटॉर्च
- रूट ( रूट के साथ TMVA)
- स्किकिट-लर्न
- शोगुन
- स्पार्क एमएललिब
- सिस्टमएमएल
- टेंसरफ्लो
- मशाल / पायटोर्च
- वेका / एमओए
- एक्सजीबूस्ट
- यूरीका
मुक्त और मुक्त स्रोत संस्करणों के साथ मालिकाना सॉफ्टवेयर
- चाकू
- रैपिड माइनर
मालिकाना सॉफ्टवेयर
- अमेज़न मशीन लर्निंग
- Angoss KnowledgeSTUDIO
- Azure मशीन लर्निंग
- अयसदी
- आईबीएम वाटसन स्टूडियो
- गूगल भविष्यवाणी एपीआई
- आईबीएम एसपीएसएस मॉडलर
- KXEN मॉडलर
- लायंस सॉल्वर
- मेथेमेटिका
- Matlab
- तंत्रिका डिजाइनर
- न्यूरो समाधान
- ओरेकल डेटा माइनिंग
- Oracle AI प्लेटफार्म क्लाउड सर्विस
- बहुविश्लेषक
- आरसीएएसई
- एसएएस एंटरप्राइज माइनर
- अनुक्रम एल
- स्प्लंक
- STATISTICA डेटा माइनर
पत्रिकाओं
- जर्नल ऑफ़ मशीन लर्निंग रिसर्च
- यंत्र अधिगम
- प्रकृति मशीन इंटेलिजेंस
- तंत्रिका गणना
सम्मेलनों
- कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन ( एसीएल )
- मशीन लर्निंग और सिद्धांतों और डेटाबेस में ज्ञान की खोज के अभ्यास पर यूरोपीय सम्मेलन ( ईसीएमएल पीकेडीडी )
- मशीन लर्निंग पर अंतर्राष्ट्रीय सम्मेलन ( आईसीएमएल )
- सीखने के प्रतिनिधित्व पर अंतर्राष्ट्रीय सम्मेलन ( आईसीएलआर )
- इंटेलिजेंट रोबोट और सिस्टम पर अंतर्राष्ट्रीय सम्मेलन ( आईआरओएस )
- ज्ञान खोज और डेटा खनन पर सम्मेलन ( केडीडी )
- तंत्रिका सूचना प्रसंस्करण प्रणाली पर सम्मेलन ( NeurIPS )
यह सभी देखें
- स्वचालित मशीन लर्निंग - मशीन लर्निंग के अनुप्रयोग को स्वचालित करने की प्रक्रिया
- बड़ा डेटा - उच्च मात्रा, वेग और विविधता की विशेषता वाली सूचना संपत्ति
- डिफरेंशियल प्रोग्रामिंग - प्रोग्रामिंग प्रतिमान
- मशीन लर्निंग में महत्वपूर्ण प्रकाशनों की सूची - विकिमीडिया सूची लेख
- मशीन-लर्निंग अनुसंधान के लिए डेटासेट की सूची - विकिमीडिया सूची लेख
संदर्भ
- ^ मिशेल, टॉम (1997)। मशीन लर्निंग । न्यूयॉर्क: मैकग्रा हिल। आईएसबीएन 0-07-042807-7. ओसीएलसी 36417892 ।
- ^ "स्पष्ट रूप से प्रोग्राम किए बिना" परिभाषा का श्रेय अक्सर आर्थर सैमुअल को दिया जाता है , जिन्होंने 1959 में "मशीन लर्निंग" शब्द गढ़ा था, लेकिन इस प्रकाशन में वाक्यांश शब्दशः नहीं पाया गया है, और यहबाद में दिखाई देने वालाएक पैराफ्रेश हो सकता है। कॉन्फर "पैराफ्रेसिंग आर्थर सैमुअल (1959), सवाल यह है: कंप्यूटर स्पष्ट रूप से प्रोग्राम किए बिना समस्याओं को हल करना कैसे सीख सकता है?" में कोज़ा, जॉन आर.; बेनेट, फॉरेस्ट एच.; आंद्रे, डेविड; कीन, मार्टिन ए. (1996). आनुवंशिक प्रोग्रामिंग का उपयोग करते हुए एनालॉग इलेक्ट्रिकल सर्किट के टोपोलॉजी और साइज़िंग दोनों का स्वचालित डिज़ाइन । डिजाइन '96 में आर्टिफिशियल इंटेलिजेंस। स्प्रिंगर, डॉर्ड्रेक्ट। पीपी. 151-170. डोई : 10.1007/978-94-009-0279-4_9 ।
- ^ हू, जे.; नीउ, एच.; कैरास्को, जे.; लेनोक्स, बी.; अरविन, एफ।, " वोरोनोई-आधारित मल्टी-रोबोट ऑटोनॉमस एक्सप्लोरेशन इन अननोन एनवायरनमेंट्स थ्रू डीप रीइनफोर्समेंट लर्निंग " आईईईई ट्रांजेक्शन ऑन वेहिकल टेक्नोलॉजी, 2020।
- ^ ए बी सी बिशप, सीएम (2006), पैटर्न रिकग्निशन एंड मशीन लर्निंग , स्प्रिंगर, आईएसबीएन 978-0-387-31073-2
- ^ मशीन लर्निंग और पैटर्न रिकग्निशन "एक ही क्षेत्र के दो पहलुओं के रूप में देखा जा सकता है।" [४] : vii
- ^ फ्रीडमैन, जेरोम एच. (1998). "डेटा खनन और सांख्यिकी: कनेक्शन क्या है?"। कंप्यूटिंग विज्ञान और सांख्यिकी । २९ (१): ३-९.
- ^ ए बी सी एथेम अल्पायदीन (2020)। मशीन लर्निंग का परिचय (चौथा संस्करण)। एमआईटी । पीपी. xix, 1–3, 13–18। आईएसबीएन 978-0262043793.
- ^ सैमुअल, आर्थर (1959)। "चेकर्स के गेम का उपयोग करके मशीन लर्निंग में कुछ अध्ययन"। आईबीएम जर्नल ऑफ रिसर्च एंड डेवलपमेंट । ३ (३): २१०-२२९। साइटसीरएक्स 10.1.1.368.2254 । डोई : 10.1147/rd.33.0210 ।
- ^ आर. कोहावी और एफ. प्रोवोस्ट, "शब्दावली की शब्दावली," मशीन लर्निंग, वॉल्यूम। 30, नहीं। २-३, पीपी २७१-२७४, १९९८।
- ^ निल्सन एन. लर्निंग मशीन्स, मैकग्रा हिल, 1965.
- ^ डूडा, आर., हार्ट पी. पैटर्न रिकग्निशन एंड सीन एनालिसिस, विले इंटरसाइंस, 1973
- ^ एस. बोज़िनोवस्की "शिक्षण स्थान: अनुकूली पैटर्न वर्गीकरण के लिए एक प्रतिनिधित्व अवधारणा" COINS तकनीकी रिपोर्ट संख्या 81-28, कंप्यूटर और सूचना विज्ञान विभाग, एमहर्स्ट में मैसाचुसेट्स विश्वविद्यालय, एमए, 1981। https://web.cs.umass .edu/publication/docs/1981/UM-CS-1981-028.pdf
- ^ ए बी मिशेल, टी। (1997)। मशीन लर्निंग । मैकग्रा हिल। पी 2. आईएसबीएन 978-0-07-042807-2.
- ^ एपस्टीन, रॉबर्ट में हरनाड, स्टीवन (2008), "द एनोटेशन गेम: ऑन ट्यूरिंग (1950) ऑन कंप्यूटिंग, मशीनरी एंड इंटेलिजेंस" ; पीटर्स, ग्रेस (संस्करण), द ट्यूरिंग टेस्ट सोर्सबुक: फिलॉसॉफिकल एंड मेथोडोलॉजिकल इश्यूज इन द क्वेस्ट फॉर द थिंकिंग कंप्यूटर , क्लूवर, पीपी 23-66, आईएसबीएन ९७८१४०२०६७०८२
- ^ "एआई भाग 1 का परिचय" । एडज़ियन । 2020-12-08 । 2020-12-09 को लिया गया ।
- ^ ए बी "मशीन लर्निंग में जैव सूचना विज्ञान पर एक अनुभवजन्य विज्ञान अनुसंधान - जर्नल" । 28 अक्टूबर 2020 को लिया गया । साइट जर्नल की आवश्यकता है
|journal=
( सहायता ) - ^ "rasbt/stat453-deep-learning-ss20" (पीडीएफ) । गिटहब ।
- ^ सरले, वारेन (1994)। "तंत्रिका नेटवर्क और सांख्यिकीय मॉडल"। साइटसीरएक्स 10.1.1.27.699 ।
- ^ ए बी सी डी रसेल, स्टुअर्ट ; नॉरविग, पीटर (2003) [1995]। आर्टिफिशियल इंटेलिजेंस: ए मॉडर्न अप्रोच (दूसरा संस्करण)। शागिर्द कक्ष। आईएसबीएन 978-0137903955.
- ^ ए बी लैंगली, पैट (2011)। "मशीन लर्निंग का बदलता विज्ञान" । मशीन लर्निंग । 82 (3): 275-279। डीओआई : 10.1007/एस10994-011-5242-वाई ।
- ^ गारबेड, डॉ माइकल जे। (14 सितंबर 2018)। "क्लियरिंग द कन्फ्यूजन: एआई बनाम मशीन लर्निंग बनाम डीप लर्निंग डिफरेंसेस" । मध्यम । 28 अक्टूबर 2020 को लिया गया ।
- ^ "एआई बनाम मशीन लर्निंग बनाम डीप लर्निंग बनाम न्यूरल नेटवर्क: क्या अंतर है?" . www.ibm.com । 28 अक्टूबर 2020 को लिया गया ।
- ^ "अध्याय 1: मशीन लर्निंग और डीप लर्निंग का परिचय" । डॉ सेबस्टियन रश्का । 5 अगस्त 2020 । 28 अक्टूबर 2020 को लिया गया ।
- ^ अगस्त 2011, डोवेल टेक्नोलॉजीज (15 मई 2018)। "सभी मशीन लर्निंग आर्टिफिशियल इंटेलिजेंस नहीं है" । सीटीओविजन डॉट कॉम । 28 अक्टूबर 2020 को लिया गया ।
- ^ "एआई टुडे पॉडकास्ट # 30: एमआईटी प्रोफेसर लुइस पेरेज़-ब्रेवा के साथ साक्षात्कार - एआई और एमएल पर विपरीत परिप्रेक्ष्य" । कॉग्निलिटिका । 28 मार्च 2018 । 28 अक्टूबर 2020 को लिया गया ।
- ^ "rasbt/stat453-deep-learning-ss20" (पीडीएफ) । गिटहब । 28 अक्टूबर 2020 को लिया गया ।
- ^ मोती, यहूदिया; मैकेंज़ी, दाना (15 मई 2018)। क्यों की पुस्तक: कारण और प्रभाव का नया विज्ञान (2018 संस्करण)। बुनियादी किताबें। आईएसबीएन ९७८०४६५०९७६०९. 28 अक्टूबर 2020 को लिया गया ।
- ^ पूल, मैकवर्थ और गोएबेल १९९८ , पृ. १ .
- ^ रसेल और नॉरविग 2003 , पृ. 55.
- ^ बुद्धिमान एजेंटों के अध्ययन के रूप में एआई की परिभाषा: * पूल, मैकवर्थ और गोएबेल (1998) , जो इस आलेख में प्रयुक्त संस्करण प्रदान करता है। ये लेखक कृत्रिम बुद्धि के पर्याय के रूप में "कम्प्यूटेशनल इंटेलिजेंस" शब्द का उपयोग करते हैं। [२८] * रसेल और नॉरविग (२००३) (जो "तर्कसंगत एजेंट" शब्द पसंद करते हैं) और लिखें "संपूर्ण-एजेंट का दृष्टिकोण अब क्षेत्र में व्यापक रूप से स्वीकार किया जाता है"। [२९] * निल्सन १९९८ * लेग एंड हटर 2007
- ^ ले रॉक्स, निकोलस; बेंगियो, योशुआ; फिट्ज़गिब्बन, एंड्रयू (2012)। "सुधार+प्रथम+और+द्वितीय-क्रम+विधि+द्वारा+मॉडलिंग+अनिश्चितता&pg=PA403 "मॉडलिंग अनिश्चितता द्वारा पहले और दूसरे क्रम के तरीकों में सुधार" । Sra, Suvrit; Nowozin, Sebastian; राइट, स्टीफन जे. (सं. ) मशीन लर्निंग के लिए ऑप्टिमाइज़ेशन । MIT प्रेस। पृष्ठ ४०४। ISBN ९७८०२६२०१६४६९.
- ^ बज़्दोक, डैनिलो; ऑल्टमैन, नाओमी ; क्रिज़ीविंस्की, मार्टिन (2018)। "सांख्यिकी बनाम मशीन लर्निंग" । प्रकृति के तरीके । १५ (४): २३३-२३४। डोई : 10.1038/एनमेथ.4642 । पीएमसी ६०८२६३६ । पीएमआईडी 30100822 ।
- ^ ए बी माइकल आई। जॉर्डन (2014-09-10)। "सांख्यिकी और मशीन लर्निंग" । रेडिट । 2014-10-01 को लिया गया ।
- ^ कॉर्नेल विश्वविद्यालय पुस्तकालय। "ब्रेइमन: सांख्यिकीय मॉडलिंग: दो संस्कृतियां (टिप्पणियों के साथ और लेखक द्वारा एक प्रत्युत्तर)" । 8 अगस्त 2015 को लिया गया ।
- ^ गैरेथ जेम्स; डेनिएला विटन; ट्रेवर हेस्टी; रॉबर्ट तिब्शीरानी (2013)। सांख्यिकीय सीखने का एक परिचय । स्प्रिंगर। पी vii.
- ^ मोहरी, महरियार ; रोस्तमीज़ादेह, अफशीन; तलवलकर, अमित (2012)। मशीन लर्निंग की नींव । यूएसए, मैसाचुसेट्स: एमआईटी प्रेस। आईएसबीएन ९७८०२६२०१८२५८.
- ^ अल्पायदीन, एथेम (2010)। मशीन लर्निंग का परिचय । लंदन: द एमआईटी प्रेस. आईएसबीएन 978-0-262-01243-0. 4 फरवरी 2017 को लिया गया ।
- ^ रसेल, स्टुअर्ट जे.; नॉरविग, पीटर (2010)। आर्टिफिशियल इंटेलिजेंस: ए मॉडर्न अप्रोच (तीसरा संस्करण)। शागिर्द कक्ष। आईएसबीएन ९७८०१३६०४२५९४.
- ^ मोहरी, महरियार; रोस्तमीज़ादेह, अफशीन; तलवलकर, अमित (2012)। मशीन लर्निंग की नींव । एमआईटी प्रेस। आईएसबीएन ९७८०२६२०१८२५८.
- ^ अल्पायदीन, एथेम (2010)। मशीन लर्निंग का परिचय । एमआईटी प्रेस. पी 9. आईएसबीएन 978-0-262-01243-0.
- ^ जॉर्डन, माइकल आई.; बिशप, क्रिस्टोफर एम। (2004)। "तंत्रिका जाल"। एलन बी टकर (एड।) में। कंप्यूटर साइंस हैंडबुक, दूसरा संस्करण (खंड VII: इंटेलिजेंट सिस्टम) । बोका रैटन, फ्लोरिडा: चैपमैन एंड हॉल/सीआरसी प्रेस एलएलसी। आईएसबीएन 978-1-58488-360-9.
- ^ एलेक्स रैटनर; स्टीफन बाख; परोमा वर्मा; क्रिस। "कमजोर पर्यवेक्षण: मशीन सीखने के लिए नया प्रोग्रामिंग प्रतिमान" । hazyresearch.github.io । हेज़ी रिसर्च के कई अन्य सदस्यों द्वारा काम का संदर्भ देना । 2019-06-06 को लिया गया ।
- ^ वैन ओटरलो, एम.; वियरिंग, एम। (2012)। सुदृढीकरण सीखने और मार्कोव निर्णय प्रक्रियाओं । सुदृढीकरण सीखना । अनुकूलन, सीखना और अनुकूलन। 12 . पीपी. 3-42. डोई : 10.1007/978-3-642-27645-3_1 । आईएसबीएन 978-3-642-27644-6.
- ^ Science.sciencemag.org/content/290/5500/2323
- ^ towarddatascience.com/all-machine-learning-models-explained-in-6-minutes-9fe30ff6776a
- ^ पावेल ब्रेज़दिल, क्रिस्टोफ़ गिरौद कैरियर, कार्लोस सोरेस, रिकार्डो विलाल्टा (2009)। धातुकर्म: डाटा माइनिंग के लिए अनुप्रयोग (चौथा संस्करण)। स्प्रिंगर साइंस+बिजनेस मीडिया । पीपी. 10-14, पासिम । आईएसबीएन 978-3540732624.CS1 रखरखाव: लेखक पैरामीटर का उपयोग करता है ( लिंक )
- ^ बोज़िनोवस्की, एस. (1982)। "माध्यमिक सुदृढीकरण का उपयोग कर एक स्व-शिक्षण प्रणाली"। ट्रैपल में, रॉबर्ट (सं।)। साइबरनेटिक्स और सिस्टम रिसर्च: साइबरनेटिक्स और सिस्टम रिसर्च पर छठी यूरोपीय बैठक की कार्यवाही। उत्तर हॉलैंड। पीपी. ३९७-४०२। आईएसबीएन 978-0-444-86488-8 ।
- ^ बोज़िनोवस्की, स्टीवो (2014) "1981 से कृत्रिम तंत्रिका नेटवर्क में अनुभूति-भावना की बातचीत के मॉडलिंग तंत्र।" प्रोसीडिया कंप्यूटर साइंस पी. 255-263
- ^ बोज़िनोवस्की, एस. (2001) "सेल्फ-लर्निंग एजेंट्स: ए कनेक्शनिस्ट थ्योरी ऑफ़ इमोशन बेस्ड ऑन क्रॉसबार वैल्यू जजमेंट।" साइबरनेटिक्स और सिस्टम 32(6) 637-667।
- ^ वाई. बेंगियो; ए कौरविल; पी. विंसेंट (2013)। "प्रतिनिधित्व सीखना: एक समीक्षा और नए परिप्रेक्ष्य"। पैटर्न विश्लेषण और मशीन इंटेलिजेंस पर आईईईई लेनदेन । ३५ (८): १७९८-१८२८। आर्क्सिव : 1206.5538 । डोई : 10.1109/tpami.2013.50 । पीएमआईडी 23787338 । S2CID 393948 ।
- ^ नाथन सेरेब्रो; जेसन डीएम रेनी; टॉमी एस. जाक्कोला (2004). अधिकतम-मार्जिन मैट्रिक्स फैक्टराइजेशन । निप्स ।
- ^ कोट्स, एडम; ली, होंगलाक; एनजी, एंड्रयू वाई। (2011)। अनसुपरवाइज्ड फीचर लर्निंग (पीडीएफ) में सिंगल-लेयर नेटवर्क का विश्लेषण । अंतर्राष्ट्रीय सम्मेलन। AI और सांख्यिकी (AISTATS) पर। से संग्रहीत मूल (पीडीएफ) 2017/08/13 पर । 2018-11-25 को लिया गया ।
- ^ सुरका, गैब्रिएला; डांस, क्रिस्टोफर सी.; फैन, लिक्सिन; विलमोव्स्की, जट्टा; ब्रे, सेड्रिक (2004). मुख्य बिंदुओं के बैग (पीडीएफ) के साथ दृश्य वर्गीकरण । कंप्यूटर विजन में सांख्यिकीय शिक्षा पर ईसीसीवी कार्यशाला।
- ^ डैनियल जुराफस्की; जेम्स एच। मार्टिन (2009)। भाषण और भाषा प्रसंस्करण । पियर्सन एजुकेशन इंटरनेशनल। पीपी. 145-146।
- ^ लू, हाइपिंग; प्लैटानियोटिस, केएन; वेनेत्सानोपोलोस, एएन (2011)। "टेन्सर डेटा के लिए मल्टीलाइनियर सबस्पेस लर्निंग का एक सर्वेक्षण" (पीडीएफ) । पैटर्न मान्यता । ४४ (७): १५४०–१५५१. डीओआई : 10.1016/जे.पैटकोग.2011.1.01.004 ।
- ^ योशुआ बेंगियो (2009)। एआई के लिए डीप आर्किटेक्चर सीखना । अब पब्लिशर्स इंक. पीपी. 1-3। आईएसबीएन 978-1-60198-294-0.
- ^ टिलमैन, एएम (2015)। "सटीक और अनुमानित शब्दकोश सीखने की कम्प्यूटेशनल इंट्रैक्टेबिलिटी पर"। आईईईई सिग्नल प्रोसेसिंग पत्र । २२ (१): ४५-४९. आर्क्सिव : १४०५.६६६४ । बिबकोड : 2015ISPL ... 22 ... 45T । डोई : 10.1109/एलएसपी.2014.2345761 । S2CID 13342762 ।
- ^ अहरोन, एम, एम एलाद, और ए ब्रुकस्टीन। 2006. " के-एसवीडी: विरल प्रतिनिधित्व के लिए पूर्ण शब्दकोश डिजाइन करने के लिए एक एल्गोरिदम ।" सिग्नल प्रोसेसिंग, आईईईई लेनदेन 54 पर (11): 4311-4322
- ^ ज़िमेक, आर्थर; शुबर्ट, एरिच (2017), "आउटलेयर डिटेक्शन", इनसाइक्लोपीडिया ऑफ डेटाबेस सिस्टम्स , स्प्रिंगर न्यूयॉर्क, पीपी. 1-5, डीओआई : 10.1007/978-1-4899-7993-3_80719-1 , आईएसबीएन ९७८१४८९९७९९३३
- ^ हॉज, वीजे; ऑस्टिन, जे। (2004)। "बाहरी पता लगाने के तरीके का एक सर्वेक्षण" (पीडीएफ) । आर्टिफिशियल इंटेलिजेंस रिव्यू । 22 (2): 85-126। साइटसीरएक्स 10.1.1.318.4023 । डीओआई : 10.1007/एस10462-004-4304-वाई । S2CID 59941878 ।
- ^ डोकास, पॉल; एर्टोज़, लेवेंट; कुमार, विपिन; लाज़रेविक, अलेक्जेंडर; श्रीवास्तव, जयदीप; टैन, पैंग-निंग (2002)। "नेटवर्क घुसपैठ का पता लगाने के लिए डेटा खनन" (पीडीएफ) । अगली पीढ़ी के डेटा माइनिंग पर कार्यवाही एनएसएफ कार्यशाला ।
- ^ चंदोला, वी.; बनर्जी, ए.; कुमार, वी. (2009)। "विसंगति का पता लगाना: एक सर्वेक्षण"। एसीएम कंप्यूटिंग सर्वेक्षण । ४१ (३): १-५८. डोई : 10.1145/1541880.1541882 । S2CID 207172599 ।
- ^ पियातेस्की-शापिरो, ग्रेगरी (1991), डिस्कवरी, एनालिसिस, एंड प्रेजेंटेशन ऑफ स्ट्रॉन्ग रूल्स , पियातेत्स्की-शापिरो, ग्रेगरी में; और फ्रॉली, विलियम जे.; एड।, डेटाबेस में नॉलेज डिस्कवरी , एएएआई/एमआईटी प्रेस, कैम्ब्रिज, एमए।
- ^ बासेल, जॉर्ज डब्ल्यू.; ग्लैब, एनरिको; मार्केज़, जूलियट; होल्ड्सवर्थ, माइकल जे.; बकार्डिट, जैम (2011-09-01)। "बड़े पैमाने पर डेटा सेट पर नियम-आधारित मशीन लर्निंग का उपयोग करके अरबिडोप्सिस में कार्यात्मक नेटवर्क निर्माण" । प्लांट सेल । २३ (९): ३१०१-३११६। डोई : 10.1105/tpc.111.088153 । आईएसएसएन 1532-298X । पीएमसी 3203449 । पीएमआईडी २१८ ९ ६८८२ ।
- ^ अग्रवाल, आर.; इमिलिंस्की, टी.; स्वामी, ए. (1993)। "बड़े डेटाबेस में वस्तुओं के सेट के बीच खनन संघ नियम"। डेटा के प्रबंधन पर 1993 के एसीएम SIGMOD अंतर्राष्ट्रीय सम्मेलन की कार्यवाही - SIGMOD '93 । पी 207. साइटसीरएक्स 10.1.1.40.6984 । डोई : 10.1145/170035.170072 । आईएसबीएन 978-0897915922. S2CID 490415 ।
- ^ अर्बनोविच, रयान जे.; मूर, जेसन एच. (2009-09-22)। "लर्निंग क्लासिफायर सिस्टम: एक पूर्ण परिचय, समीक्षा और रोडमैप" । कृत्रिम विकास और अनुप्रयोगों के जर्नल । 2009 : 1-25। डोई : 10.1155/2009/736398 । आईएसएसएन 1687-6229 ।
- ^ प्लॉटकिन जीडी ऑटोमैटिक मेथड्स ऑफ इंडक्टिव इंफरेंस , पीएचडी थीसिस, यूनिवर्सिटी ऑफ एडिनबर्ग, 1970।
- ^ शापिरो, एहुद वाई । तथ्यों से सिद्धांतों का आगमनात्मक निष्कर्ष , अनुसंधान रिपोर्ट 192, येल विश्वविद्यालय, कंप्यूटर विज्ञान विभाग, 1981। जे.-एल में पुनर्मुद्रित। लासेज़, जी. प्लॉटकिन (सं.), कम्प्यूटेशनल लॉजिक, द एमआईटी प्रेस, कैम्ब्रिज, एमए, 1991, पीपी. 199-254।
- ^ शापिरो, एहुद वाई. (1983)। एल्गोरिथम प्रोग्राम डिबगिंग । कैम्ब्रिज, मास: एमआईटी प्रेस। आईएसबीएन 0-262-19218-7
- ^ शापिरो, एहुद वाई. " द मॉडल इंट्रेंस सिस्टम ।" आर्टिफिशियल इंटेलिजेंस-वॉल्यूम 2 पर 7वें अंतर्राष्ट्रीय संयुक्त सम्मेलन की कार्यवाही। मॉर्गन कॉफ़मैन पब्लिशर्स इंक, 1981।
- ^ होंगलाक ली, रोजर ग्रोस, राजेश रंगनाथ, एंड्रयू वाई. एनजी। " पदानुक्रमित प्रतिनिधित्व के स्केलेबल अनसुपरवाइज्ड लर्निंग के लिए कनवल्शनल डीप बिलीफ नेटवर्क्स " मशीन लर्निंग पर 26वें वार्षिक अंतर्राष्ट्रीय सम्मेलन की कार्यवाही, 2009।
- ^ कोर्टेस, कोरिन्ना ; वापनिक, व्लादिमीर एन। (1995)। "समर्थन-वेक्टर नेटवर्क" । मशीन लर्निंग । २० (३): २७३–२९७। डोई : 10.1007/बीएफ00994018 ।
- ^ स्टीवेन्सन, क्रिस्टोफर। "ट्यूटोरियल: एक्सेल में बहुपद प्रतिगमन" । फैकल्टीस्टाफ.रिचमंड . edu . 22 जनवरी 2017 को लिया गया ।
- ^ गोल्डबर्ग, डेविड ई.; हॉलैंड, जॉन एच। (1988)। "जेनेटिक एल्गोरिदम और मशीन लर्निंग" (पीडीएफ) । मशीन लर्निंग । 3 (2): 95-99। डीओआई : 10.1007/बीएफ00113892 । S2CID 35506513 ।
- ^ मिची, डी.; स्पीगेलहाल्टर, डीजे; टेलर, सीसी (1994)। "मशीन लर्निंग, तंत्रिका और सांख्यिकीय वर्गीकरण"। आर्टिफिशियल इंटेलिजेंस में एलिस हॉरवुड सीरीज । बिबकोड : 1994mlns.book ..... एम ।
- ^ झांग, जून; ज़ान, ज़ी-हुई; लिन, यिंग; चेन, नी; गोंग, यू-जियाओ; झोंग, जिंग-हुई; चुंग, हेनरी एसएच ; ली, यूं; शि, यू-हुई (2011)। "विकासवादी संगणना मशीन लर्निंग से मिलती है: एक सर्वेक्षण"। कम्प्यूटेशनल इंटेलिजेंस पत्रिका । 6 (4): 68-75। डीओआई : 10.1109/एमसीआई.2011.942584 । S2CID 6760276 ।
- ^ "फेडरेटेड लर्निंग: कोलैबोरेटिव मशीन लर्निंग विदाउट सेंट्रलाइज्ड ट्रेनिंग डेटा" । गूगल एआई ब्लॉग । 2019-06-08 को लिया गया ।
- ^ मशीन लर्निंग को सीएफए पाठ्यक्रम में शामिल किया गया है(चर्चा ऊपर से नीचे है); देखें: कैथलीन डीरोज़ और क्रिस्टोफ़ ले लैनो (2020)। "मशीन लर्निंग" ।
- ^ "बेलकोर होम पेज" Research.att.com
- ^ "द नेटफ्लिक्स टेक ब्लॉग: नेटफ्लिक्स अनुशंसाएँ: 5 सितारों से परे (भाग 1)" । 2012-04-06। मूल से 31 मई 2016 को संग्रहीत किया गया । 8 अगस्त 2015 को लिया गया ।
- ^ स्कॉट पैटरसन (13 जुलाई 2010)। "मशीनों को तय करने देना" । वॉल स्ट्रीट जर्नल । 24 जून 2018 को लिया गया ।
- ^ विनोद खोसला (10 जनवरी 2012)। "क्या हमें डॉक्टरों या एल्गोरिदम की आवश्यकता है?" . टेक क्रंच।
- ^ व्हेन ए मशीन लर्निंग एल्गोरिथम ने फाइन आर्ट पेंटिंग्स का अध्ययन किया, इट सॉ थिंग्स आर्ट हिस्टोरियंस ने कभी नोटिस नहीं किया था , ArXiv ब्लॉग पर भौतिकी
- ^ विन्सेंट, जेम्स (2019-04-10)। "पहली एआई-जनरेटेड पाठ्यपुस्तक दिखाती है कि रोबोट लेखक वास्तव में क्या अच्छे हैं" । द वर्ज । 2019-05-05 को लिया गया ।
- ^ वैश्य, राजू; जावेद, मो. खान, इब्राहिम हलीम; हलीम, आबिद (1 जुलाई, 2020)। "आर्टिफिशियल इंटेलिजेंस (एआई) अनुप्रयोग COVID-19 महामारी के लिए" । मधुमेह और मेटाबोलिक सिंड्रोम: नैदानिक अनुसंधान और समीक्षाएं । १४ (४): ३३७-३३९। डोई : 10.1016/j.dsx.2020.04.012 । पीएमसी 7195043 । पीएमआईडी 32305024 ।
- ^ रेजापुरघदम, हमीद; अक्षिक, अराश; Ramkissoon, Haywantee (10 मार्च, 2021)। "समुद्री संरक्षित क्षेत्रों में आगंतुकों के हरित व्यवहार की भविष्यवाणी करने के लिए मशीन लर्निंग का अनुप्रयोग: साइप्रस से साक्ष्य" । सतत पर्यटन के जर्नल । ० : १-२५। डोई : 10.1080/09669582.021.1887878 ।
- ^ "क्यों मशीन लर्निंग मॉडल अक्सर सीखने में विफल होते हैं: क्विकटेक क्यू एंड ए" । ब्लूमबर्ग डॉट कॉम । 2016-11-10. से संग्रहीत मूल 2017/03/20 पर । 2017-04-10 को लिया गया ।
- ^ "कॉर्पोरेट एआई की पहली लहर विफल होने के लिए बर्बाद है" । हार्वर्ड बिजनेस रिव्यू । 2017-04-18 । 2018-08-20 को लिया गया ।
- ^ "क्यों एआई यूफोरिया विफल होने के लिए बर्बाद है" । वेंचरबीट । 2016-09-18 । 2018-08-20 को लिया गया ।
- ^ "9 कारण क्यों आपका मशीन लर्निंग प्रोजेक्ट विफल हो जाएगा" । www.kdnuggets.com . 2018-08-20 को लिया गया ।
- ^ "क्यों उबेर की सेल्फ-ड्राइविंग कार ने एक पैदल यात्री को मार डाला" । अर्थशास्त्री । 2018-08-20 को लिया गया ।
- ^ "आईबीएम के वाटसन ने 'असुरक्षित और गलत' कैंसर उपचार की सिफारिश की - स्टेट" । स्थिति । 2018-07-25 । 2018-08-21 को लिया गया ।
- ^ हर्नांडेज़, डेनिएला; ग्रीनवल्ड, टेड (2018-08-11)। "आईबीएम में एक वाटसन दुविधा है" । वॉल स्ट्रीट जर्नल । आईएसएसएन 0099-9660 । 2018-08-21 को लिया गया ।
- ^ रेड्डी, शिवानी एम.; पटेल, शीला; वीरिच, मेघन; फेंटन, जोशुआ; विश्वनाथन, मीरा (2020)। "सबूत को अद्यतन करने के लिए रणनीतियों के रूप में समीक्षा-की-समीक्षा और अर्ध-स्वचालन के साथ एक पारंपरिक व्यवस्थित समीक्षा दृष्टिकोण की तुलना" । व्यवस्थित समीक्षा । 9 (1): 243. डोई : 10.1186/एस13643-020-01450-2 । आईएसएसएन 2046-4053 । पीएमसी 7574591 । पीएमआईडी 33076975 ।
- ^ ए बी गार्सिया, मेगन (2016)। "मशीन में नस्लवादी"। विश्व नीति जर्नल । 33 (4): 111-117। डोई : 10.1215/07402775-3813015 । आईएसएसएन 0740-2775 । एस २ सीआईडी १५१५ ९ ५३४३ ।
- ^ कैलिस्कन, आयलिन; ब्रायसन, जोआना जे.; नारायणन, अरविंद (2017-04-14)। "भाषा निगम से स्वचालित रूप से व्युत्पन्न शब्दार्थ में मानव जैसे पूर्वाग्रह होते हैं"। विज्ञान । ३५६ (६३३४): १८३-१८६। आर्क्सिव : १६०८.०७१८७ । बिबकोड : 2017Sci ... 356..183C । डोई : 10.1126/विज्ञान.आल4230 । आईएसएसएन 0036-8075 । पीएमआईडी 28408601 । एस २ सीआईडी २३१६३३२४ ।
- ^ वांग, जिनान; दासगुप्ता, संजय (2016), ली, डीडी; सुगियामा, एम।; लक्सबर्ग, यूवी; गयोन, आई. (संस्करण), "मोनोटोनिक एम्बेडिंग के माध्यम से एल 1 निकटतम पड़ोसी खोज के लिए एक एल्गोरिथ्म" (पीडीएफ) , तंत्रिका सूचना प्रसंस्करण प्रणालियों में अग्रिम 29 , क्यूरन एसोसिएट्स, इंक।, पीपी। 983–991 , 2018-08 को पुनर्प्राप्त किया गया- 20
- ^ जूलिया एंगविन; जेफ लार्सन; लॉरेन किर्चनर; सूर्य मट्टू (2016-05-23)। "मशीन पूर्वाग्रह" । प्रोपब्लिका । 2018-08-20 को लिया गया ।
- ^ "राय | जब एक एल्गोरिथ्म आपको जेल भेजने में मदद करता है" । न्यूयॉर्क टाइम्स । 2018-08-20 को लिया गया ।
- ^ "जातिवादी गलती के लिए Google क्षमा चाहता है" । बीबीसी समाचार । 2015-07-01 । 2018-08-20 को लिया गया ।
- ^ "Google ने अपनी छवि-लेबलिंग तकनीक से गोरिल्ला को हटाकर अपने नस्लवादी एल्गोरिदम को 'निश्चित' किया" । द वर्ज । 2018-08-20 को लिया गया ।
- ^ "राय | आर्टिफिशियल इंटेलिजेंस की व्हाइट गाय समस्या" । न्यूयॉर्क टाइम्स । 2018-08-20 को लिया गया ।
- ^ मेट्ज़, राहेल। "क्यों Microsoft के किशोर चैटबॉट, Tay ने ऑनलाइन बहुत सारी भयानक बातें कही" । एमआईटी प्रौद्योगिकी समीक्षा । 2018-08-20 को लिया गया ।
- ^ सिमोनाइट, टॉम। "Microsoft का कहना है कि उसका नस्लवादी चैटबॉट दिखाता है कि कैसे AI अधिकांश व्यवसायों की मदद करने के लिए पर्याप्त रूप से अनुकूल नहीं है" । एमआईटी प्रौद्योगिकी समीक्षा । 2018-08-20 को लिया गया ।
- ^ हेम्पेल, जेसी (2018-11-13)। "मानवता के लिए मशीनों को बेहतर बनाने के लिए फी-फी ली की खोज" । वायर्ड । आईएसएसएन 1059-1028 । 2019-02-17 को लिया गया ।
- ^ कोहावी, रॉन (1995). "सटीकता अनुमान और मॉडल चयन के लिए क्रॉस-सत्यापन और बूटस्ट्रैप का एक अध्ययन" (पीडीएफ) । आर्टिफिशियल इंटेलिजेंस पर अंतर्राष्ट्रीय संयुक्त सम्मेलन ।
- ^ पोंटियस, रॉबर्ट गिलमोर; सी, कांगपिंग (2014)। "कई थ्रेसहोल्ड के लिए नैदानिक क्षमता को मापने के लिए कुल परिचालन विशेषता"। भौगोलिक सूचना विज्ञान के अंतर्राष्ट्रीय जर्नल । २८ (३): ५७०-५८३। डोई : 10.1080/13658816.2013.862623 । S2CID 29204880 ।
- ^ Bostrom, निक (2011)। "द एथिक्स ऑफ आर्टिफिशियल इंटेलिजेंस" (पीडीएफ) । मूल (पीडीएफ) से 4 मार्च 2016 को संग्रहीत । 11 अप्रैल 2016 को लिया गया ।
- ^ एडिओनवे, टोलुलोप। "जातिवादी एल्गोरिदम के खिलाफ लड़ाई" । रूपरेखा । 17 नवंबर 2017 को लिया गया ।
- ^ जेफ्रीज, एड्रियन। "मशीन लर्निंग नस्लवादी है क्योंकि इंटरनेट नस्लवादी है" । रूपरेखा । 17 नवंबर 2017 को लिया गया ।
- ^ Bostrom, निक; युडकोव्स्की, एलीएज़र (2011)। "आर्टिफिशियल इंटेलिजेंस की नैतिकता" (पीडीएफ) । निक Bostrom .
- ^ एमओआर प्रेट्स, पीएचसी एवेलर, एलसी लैम्ब (11 मार्च 2019)। "मशीन अनुवाद में लिंग पूर्वाग्रह का आकलन - Google अनुवाद के साथ एक केस स्टडी"। arXiv : १८० ९ .०२२०८ [ cs.CY ]।CS1 रखरखाव: लेखक पैरामीटर का उपयोग करता है ( लिंक )
- ^ नारायणन, अरविंद (24 अगस्त, 2016)। "भाषा में अनिवार्य रूप से मानवीय पूर्वाग्रह होते हैं, और इसी तरह भाषा निगम पर प्रशिक्षित मशीनें भी होंगी" । टिंकर को स्वतंत्रता ।
- ^ चार, डेंटन एस.; शाह, निगम एच.; मैग्नस, डेविड (2018-03-15)। "स्वास्थ्य देखभाल में मशीन लर्निंग को लागू करना - नैतिक चुनौतियों को संबोधित करना" । न्यू इंग्लैंड जर्नल ऑफ मेडिसिन । ३७८ (११): ९८१-९८३। डोई : 10.1056/एनईजेएमपी1714229 । आईएसएसएन 0028-4793 । पीएमसी 5962261 । पीएमआईडी 29539284 ।
- ^ चार, डीएस; शाह, एनएच; मैग्नस, डी। (2018)। "स्वास्थ्य देखभाल में मशीन लर्निंग को लागू करना-नैतिक चुनौतियों को संबोधित करना" । न्यू इंग्लैंड जर्नल ऑफ मेडिसिन । ३७८ (११): ९८१-९८३। डोई : 10.1056/nejmp1714229 । पीएमसी 5962261 । पीएमआईडी 29539284 ।
- ^ अनुसंधान, एआई (23 अक्टूबर 2015)। "वाक् पहचान में ध्वनिक मॉडलिंग के लिए गहरे तंत्रिका नेटवर्क" । airesearch.com । 23 अक्टूबर 2015 को लिया गया ।
- ^ "GPUs अभी के लिए AI त्वरक बाजार पर हावी होना जारी रखते हैं" । सूचना सप्ताह । दिसंबर 2019 । 11 जून 2020 को लिया गया ।
- ^ रे, टियरन (2019)। "एआई कंप्यूट की पूरी प्रकृति को बदल रहा है" । जेडडीनेट । 11 जून 2020 को लिया गया ।
- ^ "एआई और कंप्यूट" । ओपनएआई । 16 मई 2018 । 11 जून 2020 को लिया गया ।
अग्रिम पठन
- निल्स जे. निल्सन, मशीन लर्निंग का परिचय ।
- ट्रेवर हेस्टी , रॉबर्ट तिब्शीरानी और जेरोम एच. फ्रीडमैन (2001)। सांख्यिकीय शिक्षा के तत्व , स्प्रिंगर। आईएसबीएन 0-387-95284-5 ।
- पेड्रो डोमिंगोस (सितंबर 2015), द मास्टर एल्गोरिथम , बेसिक बुक्स, आईएसबीएन 978-0-465-06570-7
- इयान एच। विटन और ईबे फ्रैंक (2011)। डेटा माइनिंग: प्रैक्टिकल मशीन लर्निंग टूल्स और तकनीक मॉर्गन कॉफ़मैन, 664पीपी।, आईएसबीएन 978-0-12-374856-0 ।
- एथेम अल्पायदीन (२००४)। मशीन लर्निंग का परिचय , एमआईटी प्रेस, आईएसबीएन 978-0-262-01243-0 ।
- डेविड जेसी मैके । सूचना सिद्धांत, अनुमान, और सीखने के एल्गोरिदम कैम्ब्रिज: कैम्ब्रिज यूनिवर्सिटी प्रेस, 2003। आईएसबीएन 0-521-64298-1
- रिचर्ड ओ. डूडा , पीटर ई. हार्ट , डेविड जी. स्टॉर्क (2001) पैटर्न वर्गीकरण (द्वितीय संस्करण), विली, न्यूयॉर्क, आईएसबीएन 0-471-05669-3 ।
- क्रिस्टोफर बिशप (1995)। पैटर्न पहचान के लिए तंत्रिका नेटवर्क , ऑक्सफोर्ड यूनिवर्सिटी प्रेस। आईएसबीएन 0-19-853864-2 ।
- स्टुअर्ट रसेल और पीटर नॉरविग, (2009)। आर्टिफिशियल इंटेलिजेंस - एक आधुनिक दृष्टिकोण । पियर्सन, आईएसबीएन ९ ७८ ९ ३३२५४३५१५ ।
- रे सोलोमोनॉफ , एक आगमनात्मक अनुमान मशीन , आईआरई कन्वेंशन रिकॉर्ड, सूचना सिद्धांत पर अनुभाग, भाग 2, पीपी।, 56-62, 1957।
- रे सोलोमोनॉफ , एक आगमनात्मक निष्कर्ष मशीन एआई पर 1956 डार्टमाउथ ग्रीष्मकालीन अनुसंधान सम्मेलन से एक निजी तौर पर परिचालित रिपोर्ट ।
- केविन पी। मर्फी (2021)। संभाव्य मशीन लर्निंग: एक परिचय , एमआईटी प्रेस।
बाहरी कड़ियाँ
विकिसूक्ति पर मशीन लर्निंग से संबंधित कोटेशन
- इंटरनेशनल मशीन लर्निंग सोसाइटी
- एमलॉस ओपन-सोर्स मशीन लर्निंग सॉफ्टवेयर का एक अकादमिक डेटाबेस है।
- Google द्वारा मशीन लर्निंग क्रैश कोर्स । यह TensorFlow के उपयोग के माध्यम से मशीन सीखने पर एक निःशुल्क पाठ्यक्रम है ।