कम्प्युटरसूचना प्रविधि

आधुनिक कम्प्युटर दृष्टि। कार्य र कम्प्युटर दृष्टि प्रविधि। अजिङ्गर मा कार्यक्रम कम्प्यूटर भिजन

कसरी चित्र वा तस्वीर मा चित्रण गरिएको छ के बुझ्न कम्प्युटरमा सिकाउन? यो सरल देखिन्छ, तर एक कम्प्युटर लागि यो zeros र व्यक्तिहरूलाई जो तपाईंले महत्त्वपूर्ण जानकारी निकाल्न चाहनुहुन्छ मिलेर बस एक म्याट्रिक्स छ।

कम्प्युटर दृष्टि के हो? यसलाई आफ्नो कम्प्युटर "हेर्नुहोस्" गर्ने क्षमता छ

दृष्टि - यो प्रयोग गरेर व्यक्ति को लागि जानकारी को एक महत्वपूर्ण स्रोत हो, हामी, 70 देखि सबै जानकारी को 90% गर्न विभिन्न अनुमान अनुसार प्राप्त। र, को पाठ्यक्रम, हामी एक स्मार्ट कार सिर्जना गर्न चाहनुहुन्छ भने, हामी त्यही सीप र कम्प्युटर लागू गर्न आवश्यक छ।

कम्प्युटर दर्शनको समस्या एकदम स्पष्ट यसो गर्न सकिन्छ। "हेर्नुहोस्" के हो? यसलाई त्यहाँ देख गरेर हो जहाँ बुझे छ। त्यो कम्प्युटर दृष्टि र मानव दर्शनको मतभेद निष्कर्षमा। हाम्रो लागि दृष्टि - यो दुनिया बारेमा ज्ञान को स्रोत, साथै मेट्रिक जानकारी स्रोत - कि छ, दूरी र आकार बुझ्न सक्ने क्षमता।

जनक कर्नेल छवि

तस्विर हेर्दा, हामी विशेषताहरु को एक नम्बर द्वारा यति बोल्न, जनक जानकारी निकाल्न वर्णन गर्न सक्नुहुन्छ।

उदाहरणका लागि, यो चित्र देख, हामी बाहिर छ भनेर भन्न सकिन्छ। शहर यातायात के छ। त्यो कार छन्। हामी यो भवन र hieroglyphics कन्फिगरेसन दक्षिण-पूर्वी एशिया हो भनेर अनुमान गर्न सकिन्छ। माओत्से तुंग को पोर्ट्रेट यो बेइजिङ छ भनेर बुझ्न, र जो कोहीले प्रत्यक्ष भिडियो वा देखे भने आफै भएको थियो, यो प्रसिद्ध Tiananmen वर्ग छ कि अनुमान थियो।

के हामी यो देखेर, चित्र बारेमा थप भन्न सक्छौं? हामी, भन्न, छवि वस्तुहरू पहिचान गर्न सक्छन् मानिसहरूलाई यहाँ नजिक छन् कि - बार। यहाँ छाते, कि भवन गरेको पोस्टर। यी हुन् कक्षाहरू उदाहरणहरू क्षण लागि खोज मा संलग्न छन् जो धेरै महत्वपूर्ण वस्तुहरु छ।

अझै पनि हामी सुविधाहरू वा वस्तुहरू को विशेषताहरु केही सिक्न सक्छन्। उदाहरणका लागि, यहाँ हामी यो साधारण चिनियाँ, अर्थात्, माओत्से तुंग को एक पोर्ट्रेट छैन भनेर निर्धारण गर्न सक्नुहुन्छ।

वाहन अनुसार यो एक सार्दा वस्तु छ कि निर्धारण गर्न सकिँदैन, र यो आन्दोलन समयमा बिकृति छैन कि, कठिन छ। झण्डा यो ओब्जेक्ट बताए गर्न सकिन्छ बारेमा तिनीहरूले पनि सार्दै हुनुहुन्छ, तर तिनीहरू निरन्तर बिकृति, हार्ड छैनन्। र दृश्य त्यहाँ जो विकास झण्डा द्वारा निर्धारण गर्न सकिँदैन हावा, छ, र पनि हावा को दिशा, उदाहरणका लागि, यो बायाँबाट दायाँ उड्ने छ निर्धारण गर्न सक्नुहुन्छ।

कम्प्युटर दृष्टि मा दूरी र लम्बाईहरू

धेरै महत्त्वपूर्ण कम्प्युटर दृष्टि विज्ञान बारेमा मेट्रिक जानकारी छ। यो दूरी सबै प्रकारका छ। उदाहरणका लागि टोली लगभग 20 मिनेट धरती छन् र धेरै जवाफ किनकी, रोभर लागि विशेष महत्त्वपूर्ण छ। तदनुसार, त्यहाँ र फिर्ता लिंक - 40 मिनेट। र हामी पृथ्वीको आन्दोलन आदेशहरू लागि योजना बनाउन भने, तपाईं खातामा यो लिनु आवश्यक छ।

सफलतापूर्वक भिडियो खेल मा कम्प्यूटर दृष्टि को प्रविधि एकीकृत। भिडियो अनुसार, तपाईं वस्तुहरु, मान्छे को तीन आयोमी मोडेल बनाउन सक्नुहुन्छ, र प्रयोगकर्ता मा फोटो शहर को तीन-आयामी मोडेल पुनर्स्थापना गर्न सक्नुहुन्छ। र फेरि मा हिंड्न।

कम्प्युटर दृष्टि - एक बरु व्यापक दायरा। यसलाई राम्ररी अन्य विभिन्न विज्ञान संग intertwined छ। कम्प्युटर दृष्टि भाग यो छवि प्रशोधन क्षेत्र कब्जा र कहिलेकाहीं कम्प्युटरमा दृष्टि, ऐतिहासिक आवंटन।

विश्लेषण, ढाँचा पहिचान - उच्च बुद्धि को सिर्जना गर्न बाटो

हामीलाई अलग यी अवधारणाहरु जाँचौं।

छवि प्रशोधन - छवि, र हामी उहाँको केहि छ - यो इनपुट र आउटपुट जसमा एल्गोरिदम को एक क्षेत्र छ।

छवि विश्लेषण - जो दुई-आयामी छवि काम र यस बाट निष्कर्ष बनाउन मा केंद्रित कम्प्युटर दृष्टि, क्षेत्र छ।

ढाँचा पहिचान - एक अमूर्त गणितीय अनुशासन vectors को को रूप मा डाटा पहिचान छ। कि प्रवेश मा छ - सदिश र हामी यो संग गर्न केही छ। जहाँ सदिश छ, हामी जान्न त महत्त्वपूर्ण छन्।

कम्प्युटर दृष्टि - यो मूल दुई-आयामी तस्बिरहरू संरचना पुनर्स्थापना थियो। आज यो क्षेत्र फराकिलो भएको छ र यो छवि आधारित शारीरिक वस्तुहरु बनाउन सबै को स्वीकृति रूपमा व्याख्या गर्न सकिन्छ। त्यो छ, यो कार्य छ कृत्रिम बुद्धि को।

वस्तुहरु बीच दूरी एक मापन दुई-आयामी तस्बिरहरू मा - एक पूर्ण बिभिन्न क्षेत्रमा कम्प्युटर दृष्टि संग समानान्तर मा, geodesy मा, photogrammetry विकसित भएको छ।

रोबोट "हेर्नुहोस्" गर्न सक्नुहुन्छ

र अन्तमा - यो मिसिन दृष्टि छ। मेशिन दृष्टि अन्तर्गत रोबोट को दर्शन हो। केही उत्पादन समस्या को निर्णय छ। हामी भन्न सक्छौं कि कम्प्युटर दृष्टि - एक ठूलो विज्ञान हो। यो अन्य विज्ञान भाग केही जोडती। र कम्प्युटर दृष्टि कुनै पनि विशेष आवेदन हुन्छ, यो एक मिसिन दृष्टि मा उत्तेजित गर्दछ।

कम्प्युटर दृष्टि क्षेत्र व्यावहारिक आवेदन को एउटा ठूलो छ। यो उत्पादन को स्वचालन संग सम्बन्धित छ। उद्यम मा मिसिन द्वारा मार्गदर्शन श्रम प्रतिस्थापन गर्न थप कुशल हुन्छन्। मेशिन त्यो अनियमित काम अनुसूची थियो, सुतिरहेको छैन, थकित प्राप्त गर्दैन, त्यो एक वर्ष 365 दिन काम गर्न इच्छुक छ। त्यसैले, मेशिन काम प्रयोग गरेर हामी एक प्रत्याभूति परिणाम एक निश्चित समयमा प्राप्त गर्न सक्छन्, र यो एकदम रोचक छ। सबै कार्यहरू कम्प्युटर दृष्टि प्रणाली लागि स्पष्ट प्रयोग छ। र त्यहाँ मात्र गणना चरण मा चित्र मा परिणाम तुरुन्तै हेर्न भन्दा राम्रो केही छ।

कृत्रिम बुद्धि को दुनिया को सीमा मा

प्लस क्षेत्र - गाह्रो छ! दृष्टि लागि जिम्मेवार मस्तिष्क को एक महत्वपूर्ण भाग, र यो भनेर सिकाउन यदि छ, पूर्ण उपयोग कम्प्युटर दृष्टि, यो पूर्ण कृत्रिम बुद्धि को उद्देश्य मध्ये एक छ, आफ्नो कम्प्युटर "हेर्नुहोस्" विश्वास गरिन्छ। हामी मानव स्तर मा समस्या समाधान गर्न सक्छ भने, एकै समयमा सबैभन्दा संभावना छ, हामी ऐ समस्या समाधान हुनेछ। त्यो धेरै राम्रो छ! वा धेरै राम्रो छैन, तपाईं हेर्न भने, "टर्मिनेटर 2"।

किन दृष्टि छ - यो गाह्रो छ? एउटै वस्तुको छवि भिन्न हुन सक्छन् किनभने निकै आधारमा बाह्य कारक मा। अवलोकन अंक को वस्तु आधारमा फरक हेर्न।

उदाहरणका लागि, एक र एउटै आंकडा लागि, फरक कोण बाट लिएको। र के सबैभन्दा आंकडा रोचक छ एक आँखा, दुई आँखा र आधा हुन सक्छ। र त्यसको आधारमा सन्दर्भ मा (यदि चित्रित आँखाले एक शर्ट मा मानिसको यो तस्बिर), आँखा दुई भन्दा बढी हुन सक्छ।

कम्प्युटर अझै पनि बुझ्न छैन, तर यो "देख्नुहुन्छ"

कि गाह्रो बनाउँछ अर्को कारक - यो प्रकाश हो। विभिन्न प्रकाश संग नै दृश्य फरक हेर्नेछु। वस्तु आकार भिन्न हुन सक्छन्। यसबाहेक, कुनै पनि वर्ग को वस्तुहरु। तपाईं कसरी 2 मीटर को आफ्नो उचाइ एक मानिस बारेमा भन्न सक्छौं? केही छैन। मानव विकास र 2.3 मिटर र 80 सेमी हुन सक्छ। वस्तुहरु को अन्य प्रकार रूपमा, तर, एउटै वर्ग को वस्तुहरू छन्।

विशेष जीवित वस्तुहरु उपभेदों को एक किसिम undergo। बाल मान्छे, खेलाडीहरूलाई, पशु। चालु घोडाहरू को तस्वीर हेर्न आफ्नो माने के भइरहेको छ र पुच्छर बस असम्भव छ निर्धारण। छवि एक अतिव्यापी वस्तुहरु? तपाईं एक कम्प्युटर छवि, पनि सबैभन्दा शक्तिशाली मिसिन धकेल्नु भने सही निर्णय दिन कठिनाई पाउन।

अर्को दृश्य - यो एक भेष छ। केही वस्तुहरू, जनावर एकदम कौशलतासाथ वातावरण रूपमा masquerading, र। र एउटै स्थलहरू र रंग। तैपनि, हामी हुनत सधैं टाढाबाट देखि, तिनीहरूलाई हेर्नुहोस्।

अर्को समस्या - यो आन्दोलन। गति विश्वास नलाग्दो वस्तुहरू विरूपण undergo।

को वस्तुहरु को धेरै धेरै चर छन्। यहाँ, उदाहरणका लागि, "कुर्सी" को वस्तुहरु तलको दुई फोटो मा।

र यो तपाईं बस्न सक्छ। तर आकार, रंग, भौतिक मा विभिन्न कुराहरू, सबै कुरा एउटा वस्तु "कुर्सी" छ यस्तो छ कि एक मिसिन, सिकाउन - धेरै गाह्रो छ। यो चुनौती हो। कम्प्युटर दर्शनको विधिहरू एकीकृत गर्न -, बुझ्न र विश्लेषण, अन्दाज लगाउनु एक मिसिन सिकाउनु हो।

विभिन्न मञ्चहरूमा मा कम्प्युटर दर्शनको एकीकरण

कम्प्युटर दृष्टि को ठूलो उहाँले पहिलो अनुहार डिटेक्टर सिर्जना गर्दा थप, 2001 मा भित्र पस्नु गर्न थाले। भोयला, जोन्स: हामी यसलाई दुई लेखक गरे। यो पहिलो छिटो र भरपर्दो पर्याप्त मेशिन शिक्षाका विधिहरू शक्ति प्रदर्शन जो अल्गोरिदम थियो।

अब कम्प्युटर दृष्टि पर्याप्त नयाँ व्यावहारिक आवेदन छ - मानव अनुहार को पहिचान।

तर चलचित्र जस्तै मानिस पहिचान गर्न - अनियमित कोण, फरक प्रकाश अवस्था मा - यो असम्भव छ। तर समस्या, वा विभिन्न प्रकाश वा एक फरक पोज, पासपोर्ट मा तस्वीर जस्तै समान विभिन्न मानिसहरूको एउटा समाधान गर्न, यो सम्भव विश्वास को एक उच्च डिग्री संग छ।

एक पासपोर्ट फोटो आवश्यकताहरु अनुहार पहिचान एल्गोरिदम को सुविधा गर्न धेरै हदसम्म कारण।

उदाहरणका लागि, तपाईं एक बायोमेट्रिक पासपोर्ट छ भने, केही आधुनिक विमानस्थलको मा, तपाईं स्वचालित राहदानी नियन्त्रण प्रणाली प्रयोग गर्न सक्नुहुन्छ।

कम्प्युटर दर्शनको Unsolved समस्या - कुनै पनि पाठ पहिचान गर्न सक्ने क्षमता

शायद प्रयोग कसैले OCR प्रणाली। यी मध्ये एक - एक असल पाठक, RuNet सिस्टम धेरै लोकप्रिय छ। तपाईं डाटा भर्न जहाँ धेरै प्रकारका, तिनीहरूले पूर्ण स्क्यान गरिन्छ, जानकारी धेरै राम्रो सिस्टम द्वारा मान्यता प्राप्त छ छन्। तर चित्रमा कुनै पनि पाठ स्थिति धेरै खराब छ। यो समस्या अझै पनि unsolved रहनेछ।

कम्प्युटर दृष्टि मुछिएको खेल, गति कब्जा

अलग ठूलो क्षेत्र - तीन-आयामी मोडेल र गति कब्जा (कम्प्युटर गेम मा एकदम सफलतापूर्वक कार्यान्वयन गरिएको छ जो) को सृष्टि हो। कम्प्युटर दृष्टि प्रयोग गर्ने पहिलो कार्यक्रम, - साथ इशाराहरू प्रयोग गरेर कम्प्युटर अन्तरक्रिया एक प्रणाली। यो सिर्जना गरिएको थियो जब यो खुला कुराहरू धेरै थियो।

यस तर्कको एकदम बस डिजाइन गरिएको छ, तर यो एक लाख तस्वीर प्राप्त गर्न मानिसहरूको कृत्रिम तस्बिरहरू एक बिजुली सिर्जना गर्न लिए कन्फिगर गर्न। अब उहाँले राम्रो काम गर्दछ जो लागि अल्गोरिदम, को मापदण्डहरु चयन गर्न तिनीहरूलाई सुपर।

एक लाख छवि र सप्ताह countable सुपर कम्प्युटर समय सम्भव खपत एक प्रोसेसर को क्षमता 12% र अनुमति वास्तविक समयमा स्थिति बुझ्ने एक व्यक्ति एक अल्गोरिदम सिर्जना गर्न छ। यो माइक्रोसफ्ट Kinect प्रणाली (2010)।

सामग्री द्वारा तस्वीरहरू खोज्नुहोस् तपाईं सिस्टम फोटो अपलोड गर्न अनुमति दिन्छ, र यो परिणाम नै सामग्री संग सबै तस्वीर दिन र उही कोणबाट गरे हुनेछ।

कम्प्युटर दर्शनको उदाहरण: तीन आयोमी र दुई-आयामी नक्सा अब यसलाई बनाइएको भइरहेका छन्। नेभिगेसन कारहरुको लागि नक्सा नियमित DVR अनुसार अपडेट छन्।

त्यहाँ geotagged तस्बिरहरू अरबौंको एक डेटाबेस छ। डाटाबेस मा तस्वीर डाउनलोड गरेर, तपाईं जहाँ बनाइएको थियो, र पनि केही दृष्टिकोण साथ निर्धारण गर्न सक्नुहुन्छ। निस्सन्देह, ठाउँ पनि पर्यटकहरु एक समयमा पर्याप्त छ कि लोकप्रिय छ कि प्रदान र क्षेत्र को फोटो को एक नम्बर त्यहाँ भएको गरे।

रोबोट जताततै छन्

कुनै पनि तरिका मा बिना वर्तमान समय, जताततै मा, रोबोटिक्स। अब चालक (हेर्न एक कम्प्यूटर कार्यक्रम तरिकामा यो, को मोटरहाक्ने व्यक्ति मद्दत गर्छ) आदेशहरू प्रसारित गर्न पदयात्रीहरुलाई र सडक संकेत पहिचान विशेष क्यामेरा छ कि वाहन छन्। र त्यहाँ एक पूर्ण स्वचालित रोबोट वाहन छ, तर तिनीहरूले थप जानकारी को एक ठूलो रकम को प्रयोग बिना भिडियो क्यामेरा सिस्टम मा केवल भर गर्न सक्दैन।

आधुनिक क्यामेरा - यो एनालग क्यामेरा obscura छ

गरेको डिजिटल छवि कुरा गरौं। आधुनिक डिजिटल क्यामेरा क्यामेरा obscura को सिद्धान्त मा प्रबन्ध छन्। बरु मात्र हल्का बीम प्रवेश र विषय सर्किट को कोठामा पछाडि पर्खाल मा अनुमान जो मार्फत प्वाल को, हामी एक विशेष अप्टिकल सिस्टम लेन्सको भनिन्छ छन्। यसको वस्तु एक ठूलो ज्योति बीम सङ्कलन र सबै रेज गर्ने प्रक्षेपण प्राप्त र फिलिम वा म्याट्रिक्स मा छवि गठन गर्ने क्रममा भर्चुअल बिन्दु मार्फत पारित ताकि यसलाई रूपान्तरण गर्न छ।

आधुनिक डिजिटल क्यामेरा (म्याट्रिक्स) व्यक्तिगत तत्व बनेको छ - पिक्सेल। प्रत्येक पिक्सेल पिक्सेल कुल मा घटना हो जो प्रकाश को ऊर्जा मापन गर्न सक्नुहुन्छ, र एक उत्पादन नम्बर जारी। कम्प्युटर - त्यसैले, एक डिजिटल क्यामेरा, हामी छवि चमक सेट प्रकाश माप, एकल पिक्सेल मा समातिए सट्टा प्राप्त दृश्य को क्षेत्र। तसर्थ, हामी देख्न छवि रेखा र स्पष्ट आकृति र विभिन्न रंग मा रंग वर्गहरूको ग्रिड बगिरहेको छ जब - पिक्सेल।

तपाईं संसारमा पहिलो डिजिटल छवि हेर्न तल।

तर यो चित्र छैन? रंग। रंग कस्तो छ?

रंग को मनोवैज्ञानिक धारणा

रंग - यो हामी के देख्न छ। मानिसहरूलाई र बिरालोहरु लागि एक को रंग र एउटै कुरा फरक हुनेछ। हामी (मानव) र पशु अप्टिकल सिस्टम देखि - दर्शनले फरक छ। तसर्थ, रंग - यो वस्तुहरु र प्रकाश नियालेर गर्दा हुन्छ भन्ने हाम्रो दृष्टि को मनोवैज्ञानिक गुणस्तर छ। र वस्तु र प्रकाश को एक भौतिक सम्पत्ति। रंग - प्रकाश घटक को अन्तरक्रिया र हाम्रो दृश्य प्रणाली को दृश्य को परिणाम हो।

अजिङ्गर पुस्तकालयहरु प्रयोग गरी कार्यक्रम कम्प्यूटर भिजन

तपाईं कम्प्युटर दर्शनको अध्ययन मा गम्भीर संलग्न निर्णय गर्नुभएको छ भने, तुरुन्तै कठिनाइ एक नम्बर को लागि तयारी गर्नुपर्छ, यो विज्ञान छैन सजिलो छ र पासो एक नम्बर लुकाउँछ। तर जनवरी एरिक Solema को ग्रन्थकारिता "को अजिङ्गर मा प्रोग्रामिङ कम्प्यूटर भिजन" - सबै भन्दा सरल भाषा रूपरेखा एक पुस्तक। यहाँ तपाईँले 3D मा विभिन्न वस्तुहरु को पहिचान को तरिका थाह पाउनुहुनेछ, स्टेरियो छवि, भर्चुअल वास्तविकता र कम्प्युटर दृष्टि अन्य थुप्रै आवेदन काम गर्न सिक्न। पुस्तकमा अजिङ्गर पर्याप्त उदाहरण हुन्। तर व्याख्या धेरै अनुसन्धान र कडा डाटा अधिभार छैन ताकि त, बोल्न सामान्यिकृत, प्रस्तुत छ। विद्यार्थी, एमेच्योर र उत्साही लागि उपयुक्त काम। कम्प्युटर दृष्टि (PDF-ढाँचा) को बारे यो पुस्तक र अरूलाई डाउनलोड नेटवर्क मा हुन सक्छ।

क्षणमा, कम्प्युटर दृष्टि एल्गोरिदम र छवि प्रशोधन र संख्यात्मक एल्गोरिदम OpenCV को खुला स्रोत पुस्तकालय छन्। यो भन्दा आधुनिक कार्यक्रम भाषाहरु मा लागू छ, खुला स्रोत हो। हामी कम्प्युटर दृष्टि कुरा भने, अजिङ्गर यो पनि पुस्तकालयको समर्थन छ, एक कार्यक्रम भाषाको रूपमा प्रयोग गर्दछ, साथै, यो निरन्तर विकसित छ र एउटा ठूलो समुदाय छ।

कम्पनी "माइक्रोसफ्ट" यसको सेवा अपी-सक्षम मान्छे को तस्बिरहरूको साथ यो काम गर्न तन्त्रिका सञ्जाल तालिम प्रदान गर्दछ। कम्प्युटर दृष्टि लागू गर्न मौका पनि छ, अजिङ्गर एक कार्यक्रम भाषाको रूपमा प्रयोग गर्दछ।

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ne.delachieve.com. Theme powered by WordPress.