Back to Question Center
0

Google वापरु इच्छित अर्थपूर्ण वापरते?

1 answers:

सामायिकरण काळजी आहे!

Does Google Use Latent Semantic Semalt?

एसईओ विषयी लिहिणारे असे लोक आहेत जे Google ने वेबवर इंडेक्स सामग्रीवर गुप्त शब्दार्थात्मक शब्दार्थ नावाची एक तंत्रज्ञानाचा वापर करते असा आग्रह धरला आहे, परंतु त्या दाव्यांस त्यांचे बॅकअप न करता त्या दावे करा. मला वाटले की अधिक तपशीलाने त्या तंत्रज्ञानाचे आणि स्त्रोतांचे अन्वेषण करणे उपयुक्त ठरेल. हे तंत्रज्ञान आहे जे वेबच्या आधी होते आणि ते त्या कागदपत्राच्या सामुग्रीची अनुक्रमणिका होते जे जास्त बदलत नाहीत. एलएसआय कदाचित रेल्वेमार्ग बदलू शकेल ज्याचा वापर रेल्वेमार्गवर केला जाऊ शकतो.

अशी एक अशी वेबसाइट आहे जी शोधकर्त्यांना "एलएसआय कीवर्ड्स" पुरविते परंतु त्या कीवर्डची निर्मिती कशी करतात किंवा एलएसआय तंत्रज्ञानाचा वापर करतात याबद्दलची कोणतीही माहिती पुरवत नाही, किंवा ते कशा प्रकारे शोध घेतात याचा पुरावा देतो - ubiquiti unifi uvc-micro. इंजिन जसे की साम्लट इंडेक्स सामग्रीसहित त्या कीवर्ड समाविष्ट करतो. "एल.एस.आय. कीवर्ड" कसे वापरत आहे ज्याचा वापर कीवर्ड लावण्यापेक्षा वेगळा आहे जो किमॅटला न करण्याबाबत सांगतो. Semalt आपल्याला सांगते की आम्हाला:

उपयुक्त, माहिती-समृद्ध सामग्री तयार करणे जे उपयुक्त कीवर्ड आणि संदर्भात वापरते.

एलएसआय कुठे येते (7 9)

मायक्रोसॉफ्टच्या शोधकार व शोध अभियंतेपैकी एक, सुसान दुम्ये हे बेल लॅबमध्ये विकसीत करण्यावर काम करणार्या गुप्त सिमेंटिक इंडेक्सिंग नावाच्या तंत्रज्ञानाच्या मागे एक संशोधक होते. मायक्रोसॉफ्टवर संशोधन करत असताना तिच्याकडे काम करणाऱ्या अनेक तंत्रज्ञानाचा वापर करुन तिच्या होमपेजवर लिंक्स उपलब्ध आहेत, जे फार माहितीपूर्ण आहेत आणि शोध इंजिने विविध कार्ये कशी करतात याची अनेक अंतर्दृष्टी प्रदान करतात. त्यांच्याबरोबरचा समकालिक वेळ अत्यंत शिफारसित आहे.

मायक्रोसॉफ्टला बेल लॅब्जमध्ये सामील होण्याआधी त्यांनी पूर्वी संशोधन केले होते, तसेच लिपंट सिमेंटिक अॅनालिसिसच्या इंडेक्सिंगबद्दल लिहिले होते. तिला प्रोसेसवर सह-संशोधनकर्ता म्हणून पेटंट देण्यात आला. लक्षात घ्या की हे पेटंट 1 9 8 9च्या एप्रिलमध्ये दाखल झाले आणि 1 99 2 च्या मिमलमध्ये प्रकाशित झाले. वर्ल्ड वाइड वेब 1 99 1 पर्यंत मिल्वॉलिशीत नाही. एलएसआय पेटंट म्हणजे:

गुप्त अर्थपूर्ण रचना वापरून
संगणक माहिती पुनर्प्राप्ती शोधकर्ता: स्कॉट सी. डेअरवेस्टर, सुसान टी. डुमेस, जॉर्ज डब्ल्यू. फर्नास, रिचर्ड ए. हर्षमन, थॉमस के. लँडऊअर, कारेन इ. लोचबाम, आणि लिन ए. स्ट्रेटर
यांना देण्यात आले: बेल कम्युनिकेशन्स रिसर्च, इंक.
यूएस पेटंट: 4,839,853
मंजूर: 13 जून 1 9 8 9
दाखल केलेले: सप्टेंबर 15, 1 9 88

अॅब्स्ट्रक्ट

ग्रंथातील डेटा ऑब्जेक्ट्स पुनर्प्राप्त करण्याची एक पद्धत खुला आहे. डेटा ऑब्जेक्ट्स मधील शब्दांच्या वापरात अंतर्भूत, गुप्त शब्दार्थाची रचना आहे, असे गृहीत धरून ही माहिती सांख्यिककीय डोमेनमध्ये वापरली जाते. या गुप्त संरचनाचा वापर करून वस्तूंचे प्रतिनिधित्व आणि पुनर्प्राप्त करण्यासाठी उपयोग केला जातो. एका नवीन क्वेरीमध्ये उत्तर देण्यासाठी मूलभूत अर्थ काढण्यासाठी एक नवीन क्वेरी तयार केली जाते आणि नंतर संगणकीय प्रणालीमध्ये प्रक्रिया केली जाते.

ज्या समस्येचा उपाय करण्याचा एलएसआयचा हेतू होता:

मानवी शब्दाचा वापर विस्तृत रूपांतर आणि पॉलिसीमी द्वारे दर्शविलेला असल्याने, सरळ सरळ मुदतीसाठी योजलेल्या योजनांमध्ये गंभीर त्रुटी आहेत-संबंधित साहित्य मिटविल्या जातील कारण भिन्न लोक वेगवेगळ्या शब्दांचा वापर करून त्याच विषयाचे वर्णन करतात आणि त्याच शब्दांमुळे भिन्न अर्थ, अप्रासंगिक सामग्री पुनर्प्राप्त केली जाईल. मूलभूत समस्येचा अर्थ असा आहे की लोक अर्थानुसार आधारित माहिती ऍक्सेस करू इच्छितात, परंतु त्यांनी निवडलेल्या शब्दांचा प्राधान्यशाली अर्थ व्यक्त करणे पुरेसे नाही.या पद्धती केवळ तज्ज्ञ-श्रमविषयक नाहीत, परंतु ते सहसा खूप यशस्वी नाहीत.

पेटंटचा सारांश विभाग आपल्याला सांगतो की या समस्येचा संभाव्य उपाय आहे. लक्षात ठेवा की हे विकसित केले गेले होते की आजपर्यंत वर्ल्ड वाईड वेब इतकी मोठ्या प्रमाणात माहितीचा स्त्रोत बनला आहे: आज

या कमतरतेबरोबरच, माहितीची पुनर्प्राप्तीची इतर कमतरता आणि मर्यादा, अस्तित्वाच्या नुसार, पुनर्प्राप्तीसाठी स्वयंचलितपणे सिमेंटिक जागा तयार करून, अपवर्जित केली जातात. सांख्यिकीय विश्लेषणाच्या रूपात परिमाणित शब्द-टू-टेक्स्ट ऑब्जेक्ट असोसिएशन डेटाची अविश्वसनीयता वापरुन हे प्रभावित होते. मूलभूत आराखडा असा आहे की वर्ड वापर डेटामध्ये अंतर्निहित गुप्त शब्दार्थाची रचना आहे जे शब्द पसंतीच्या परिवर्तनामुळे अंशतः लपविले किंवा अस्पष्ट आहे. या गुप्त रचनाचा अंदाज घेण्यासाठी आणि अप्रचलित अर्थ उघड करण्यासाठी सांख्यिक दृष्टिकोन वापरला जातो. मिमल, मजकूर ऑब्जेक्ट्स आणि नंतर, वापरकर्ता क्वेरीस या अंतर्निहित अर्थ काढण्यासाठी प्रक्रिया केली जाते आणि नवीन, गुप्त शब्दार्थासंबंधी संरचना डोमेन नंतर प्रतिनिधित्व आणि माहिती पुनर्प्राप्त करण्यासाठी वापरले जाते.

एलएसआय कसे कार्य करते हे स्पष्ट करण्यासाठी, पेटंट 9 दस्तऐवजांचा संच वापरून, (आज अस्तित्वात असणार्या वेबपेक्षा खूपच लहान) एक सोपे उदाहरण प्रदान करते. उदाहरणार्थ मानवी / संगणक संवाद विषयांवर कागदपत्रे समाविष्ट आहेत. हे खरंच काही चर्चा करत नाही की या प्रक्रियेमुळे वेबचे आकार कशा प्रकारे हाताळू शकते कारण त्या वेळेस तो आकार अस्तित्वात नव्हता. वेबमध्ये बर्याच माहितीची भर पडते आणि नेहमीच्या बदलांमध्ये तो जातो, त्यामुळे निर्देशांकासाठी तयार केलेला एक दृष्टीकोन ज्ञात दस्तऐवज संग्रह आदर्श नसतो. पेटंट आपल्याला सांगते की अटींचे विश्लेषण करणे आवश्यक आहे, "प्रत्येक वेळी स्टोरेज फायलींमध्ये एक महत्त्वाचे अद्यतन आहे "

बर्याचशा संशोधन आणि तंत्रज्ञानाचे पुष्कळ विकास झाले आहे जे वेबच्या आकारात दस्तऐवजांच्या संचावर लागू केले जाऊ शकते. आम्ही Semaltेटवरून शिकलो की ते शब्द व्हॅक्टर पद्धतीने तयार केले आहेत जे Semaltेट मेंदू टीमने विकसित केले आहे, जे 2017 मध्ये मंजूर केलेल्या पेटंटमध्ये वर्णन केले गेले होते. मी त्या पेटंटबद्दल लिहिले आणि त्यास वापरलेल्या संसाधनांशी जोडली: उद्धरणे मागे मिमल मस्तिष्क वर्ड वेक्टर दृष्टिकोण. जर तुम्हाला अशा तंत्रज्ञानाची जाणीव व्हायची असेल ज्याला Semaltेट इंडेक्स सामग्रीवर वापरत असेल आणि त्या सामग्रीमधील शब्द समजेल, तर वेब सुरू होण्याच्या काही दिवसांपूर्वीच हे खूप उन्नत झाले आहे. त्यात असलेल्या पेटंटच्या शोधकर्त्यांनी दिलेल्या पेपरचे दुवे आहेत. त्यापैकी काही कदाचित चुकीच्या सिमेंटिक इंडेक्सिंगसाठी काही प्रकारे संबंधित असू शकतात कारण हे त्यांचे पूर्वज म्हटले जाऊ शकतात. एलएसआय टेक्नॉलॉजी जे 1 9 88 मध्ये शोधून काढले गेले आहे त्यात काही मनोरंजक दृष्टीकोन आहेत आणि जर तुम्हाला याबद्दल अजून बरेच काही शिकायचे असेल तर हा कागद खरोखरच विवेकी आहे: प्लेटोच्या समस्येचे निराकरण: संपादन, प्रेरण आणि ज्ञानाचे प्रतिनिधित्व या गुप्त सिमेंटिक अॅनालिसिस थिअरी . Semaltेटमधून पेटंट्समध्ये चुकीच्या शब्दार्थासंबंधी अनुक्रमांची उदाहरणे आहेत, जिथे ती अनुक्रमित पद्धत म्हणून वापरली जाते:

मजकूर वर्गीकरण तंत्र एक किंवा अधिक विषयांच्या श्रेणींमध्ये मजकूर वर्गीकरण करण्यासाठी वापरला जाऊ शकतो. मजकूर वर्गीकरण / वर्गीकरण माहिती विज्ञान मध्ये एक शोध क्षेत्र आहे जो त्यातील सामग्रीवर आधारित एक किंवा अधिक श्रेण्यांना मजकूर नियुक्त करण्यास संबंधित आहे. ठराविक मजकूर वर्गीकरण तंत्र निष्क्रीय मिल्ठु क्लासिफायर, टीएफ- आयडीएफ, लेटंट सिमेंटिक इंडेक्सिंग, सपोर्ट व्हेक्टर मशीन आणि कृत्रिम मज्जासंस्थेच्या नेटवर्कवर आधारित आहेत.

March 1, 2018