............................

วันอาทิตย์ที่ 16 มกราคม พ.ศ. 2554

ความรู้เกี่ยวกับ search engine

search engine

ความหมาย
เสิร์ชเอนจิน (search engine) คือ โปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบนอินเทอร์เน็ต โดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย. เสิร์ชเอนจินส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญ (คีย์เวิร์ด) ที่ผู้ใช้ป้อนเข้าไป จากนั้นก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมา ในปัจจุบัน เสิร์ชเอนจินบางตัว เช่น กูเกิล จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป

ประเภทของ search engine

Search Engine มีกี่ประเภท ?
Search Engine มี?3?ประเภท (ในวันที่ทำการศึกษาข้อมูลนี้และได้ทำการรวบรวมข้อมูล ผมสรุปได้?3 ประเภทหลัก) โดยมีหลักการทำงานที่ต่างกัน และ การจัดอันดับการค้นหาข้อมูลก็ต่างกันด้วยครับ เพราะมีลักษณะการทำงานที่ต่างกันนี่เองทำให้ โดยทั่ว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่ที่พอสรุปได้ก็มีเพียง?3 ประเภทหลัก ๆ ดังที่จะนำเสนอต่อไปนี้ครับ
ประเภทที่ 1 Crawler Based Search Engines
Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน

โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำหน้าที่ในการตรวจหา และ ทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine
Robots
ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com


Crawler Based Search Engine ได้แก่อะไรบ้าง
จะยกตัวอย่างคร่าว ๆ ให้ได้เห็นกันเอาแบบที่เรา ๆ ท่าน ๆ รู้จักหนะครับก็ได้แก่? Google , Yahoo, MSN, Live, Search, Technorati (สำหรับ blog)?ครับ ส่วนลักษณะการทำงาน และ การเก็บข้อมูงของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และ การจัดอันดับข้อมูลที่ต่างกันนะครับ เช่น คุณทำการค้นหาคำว่า “Search Engine คืออะไร” ผ่านทั้ง 5 แห่งที่ผมให้ไว้จะได้ผลการค้นหาที่ต่างกันครับ

ประเภทที่ 2 Web Directory หรือ Blog Directory
Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งผมจะขอยกตัวอย่างดังนี้


ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory
1. ODP หรือ Dmoz ที่หลาย?ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยเราด้วยครับ (URL : http://www.dmoz.org )
2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com )
3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้ครับ

ประเภทที่ 3 Meta Search Engine
Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ
ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย?ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.
มาถึงตอนนี้หลาย ๆ ท่านที่เคยสงสัยว่า “Search Engine คืออะไร” คงได้หายสงสัยกันไปบ้างแล้วและเริ่มเข้าใจหลักการทำงานของ Search Engine กันมากขึ้น เพื่อจะได้เลือกใช้อย่างถูกต้องและตรงกับความต้องการของเราในการค้นหาข่าวสารข้อมูล สำหรับบทความ “Search Engine คืออะไร” นี้หากขาดตกบกพร่องประการใด หรือ ไม่ได้รับข้อมูลที่ชัดเจนท่านสามารถติชม หรือ ให้ข้อเสนอแนะต่าง ๆ ผ่าน Comments ของบทความชุดนี้เพื่อจะได้ทำการปรับปรุงและแก้ไขให้ได้ข้อมูลที่ดีที่สุดและ เป็นประโยชน์สำหรับ ผู้ที่ทำการค้นคว้างข้อมูลต่าง ๆ เพื่อนำไปใช้งาน


การใช้งาน

 โดย ปกติแล้วเมื่อจัดทำเว็บไซต์ขึ้นแล้ว จะต้องทำการประชาสัมพันธ์ เว็บไซต์ของเรา ให้เป็นที่รู้จัก เพื่อที่คนจะได้เข้ามาดูข้อมูลที่เราต้องการเผยแพร่ได้
หากเราทำเว็บไซต์ไว้เฉย ๆ โดยไม่มีการประชาสัมพันธ์ หรือ บอกกล่าวกับผู้คน ก็จะทำให้เว็บไซต์เรา เปรียบเสมือน หนังสือ ที่วางไว้เฉยๆ โดยไม่มีคนอ่าน หรือ ทางภาษาทางการตลาดว่า "เว็บตาย"
นั่นเอง
หากเราจะทำเว็บและไม่ได้คิดถึงการทำตลาด การประชาสัมพันธ์ เว็บไซต์ ในด้านต่าง ๆ ก็ไม่มีประโยชน์เท่าใด เพราะถึงทำไปก็ไม่มีคนมาเข้าเว็บไซต์ของเราอยู่ดี ซึ่งการทำตลาดผ่านเว็บไซต์ มีได้ในหลายๆ ช่องทาง ก่อนที่เราจะรู้วิธี การทำการตลาดผ่าน Search Engine เรามาทำความรู้จัก "เว็บไซต์ค้นหา" กันก่อน

การทำ Search Engine มีหลายแบบ ได้แก่
1. การแนะนำผ่าน Search Engine ของต่างประเทศ
เครื่องมือที่ได้รับความนิยมสูงที่สุดเพื่อการประชาสัมพันธ์หรือโปรโมทเว็บไซต์เปรียบเสมือนคนที่มีความกว้างขวางและคอยแนะนำให้นักท่องเน็ตรู้จักเว็บไซต์ต่าง ๆ โดยนายโฮสดอทคอมจะแนะนำผ่าน Search Engine ของต่างประเทศ มากถึง 100 แห่ง ซึ่งประกอบด้วย Search Engine ที่ได้รับความนิยมสูงทั้งหลายเช่น yahoo!, altavista, google, go, excite, lycos, powersearch, earthfine, และอื่น ๆ อีกมาก (Search Engine คือ เว็บไซต์ที่ทำหน้าที่เป็นแหล่งรวบรวมเว็บไซต์อื่น ๆ และสามารถค้นหาเว็บไซต์เป้าหมายได้ด้วยชื่อหมวด Category หรือคำค้น Keyword)

2. การแนะนำผ่าน
Seach engine และเว็บไซต์ไดเร็คตอรี่ของไทย
เว็บไซต์ของคนไทยจำนวนมากที่มีเนื้อหาเป็นภาษาไทยและสร้างขึ้นโดยมีเป้าหมายคือกลุ่มคนไทย ดังนั้นการแนะนำเว็บไซต์ของท่านผ่าน Search Engine สัญชาติไทยจึงเป็นสิ่งที่หลีกเลี่ยงไม่ได้ และรวมไปถึงเว็บไซต์ของไทยรายอื่น ๆ ที่มีลักษณะเป็นไดเร็คตอรี่เพื่อการจัดหมวดหมู่เว็บไซต์อื่นด้วยโดย นายโฮสดอทคอม ได้รวบรวมเว็บไซต์เหล่านี้จำนวนกว่า 100 ไซต์
อาทิ sanook, hunsa, 108-1009, mthai, lemononline, catcha, yumyai, I-kool, thaiwebhunter, siamguru,
thaiseek, thaicast, thaimisc และอื่น ๆ อีกมาก

การทำงานของเว็บไซต์ค้นหา
ก่อนที่เราจะใช้ เว็บไซต์ค้นหา ในการทำตลาดให้กับเว็บไซต์ของเรา เรามาดูวิธีการทำงานของเว็บไซต์ค้นหาต่าง ๆ กันก่อนดีกว่า ปกติแล้วเว็บไซต์ค้นหาจะแบ่งออกเป็น 3 จำพวกนั่นคือ
Search Engine เป็นเว็บไซต์ที่มีเครื่องมือในการที่จะค้นหาเว็บไซต์ต่าง ๆ มาเก็บไว้ในฐานข้อมูลของตัวเองโดยอัตโนมัติ เช่น Google.com หรือ Altavista.com ซึ่งเครื่องมือนี้ มีชื่อเรียกว่า Search Robot จะทำหน้าที่คอยวิ่งเข้าไปอ่านข้อความจากหน้าเว็บไซต์ ของเว็บต่าง ๆ แล้วนำมาจัดลำดับคำค้นหา (Index) ที่มีในเว็บไซต์เหล่านั้น เก็บไว้ในฐานข้อมูลของตนเอง เมื่อเราเข้าไปใช้บริการ กับ Search Engine ต่าง ๆ ก็จะเป็นการไปค้นหาคำต่าง ๆ ที่ Search Engine ได้เก็บรวบรวมไว้แล้วนั่นเอง
Web Directory เป็นเว็บไซต์ค้นหาที่ใช้วิธีการ เพิ่มข้อมูลเข้าไปในฐานข้อมูลของระบบด้วย กำลังคน (มีเจ้าหน้าที่คอยเพิ่มข้อมูลเข้าไป) จะไม่มีการส่ง Robot ออกไปค้นด้วยตนเองแต่อย่างใด ซึ่งการจะนำชื่อเว็บไซต์ของเราให้เข้าไปอยู่ใน Web Directory นี้จะต้องไปทำการเพิ่มชื่อเข้าไปเอง เว็บประเภทนี้ก็เช่น Yahoo.com และ Dmoz.org
Meta Engine เป็นเว็บไซต์ที่ไปค้นหาจากเว็บไซต์ค้นหาอีกที ซึ่งเว็บประเภท Meta Crawler นี้จะทุ่นแรง โดยการนำคำทีต้องการค้น ไปค้นจากเว็บค้นหาประเภทต่าง ๆ และนำมาแสดงรวมกันให้เราดูอีกที ซึ่งก็สะดวกไปอีกแบบหนึ่งครับ เว็บประเภทนี้ก็เช่น Metacrawler.com, Go2net.com และ Thaifind.com
แถมให้ เพิ่มเติม
วิธีการหาข้อมูลที่ต้องการให้พบ

การ หาข้อมูลที่ต้องการให้พบ ไม่ใช่เรื่องยาก หากมีเทคนิคนิด ๆ หน่อย... โดยปกติแล้วการค้นหาข้อมูลที่ต้องการก็เพียงแค่ เราไปใส่คำที่ต้องการค้นหาในเว็บไซต์ค้นหา แล้ว กดปุ่ม สำหรับค้น ก็จะมีข้อมูลต่าง ๆ ออกมาให้เราเลือก ว่าใช่เรื่องที่เราต้องการค้นหาหรือไม่ แต่หากเราใช้คำหลาย ๆ คำเช่น Bronze Sculpture Thailand บางทีอาจจะทำให้เว็บไซต์ค้นหา แสดงผลออกมาได้ไม่ตรงกับความต้องการก็ได้ ซึ่งในเกือบทุก ๆ เว็บไซต์ค้นหา จะยอมรับคำสั่งทั่ว ๆ ไป ในการแสดงผลลัพธ์ ซึ่งหากเรานำคำสั่งเหล่านั้นมาใช้ ก็จะช่วยให้เราค้นหาข้อมูลที่ต้องการได้เร็ว ซึ่งคำสั่งทั่ว ๆ ไปมีดังนี้ 

AND เป็น คำสั่งให้รวมคำค้นหาที่อยู่ระหว่าง AND เข้าด้วยกัน เช่น Bronze AND Thailand เว็บไซต์ค้นหา จะไปหาหน้าเว็บไซต์ที่มี ทั้งคำว่า Bronze และ Thailand อยู่ในหน้าเดียวกันออกมา วิธีใช้คำสั่งจะสามารถใช้ได้ในหลายรูปแบบดังนี้ Bronze AND Thai, "Bronze Thai", Bronze + Thai, Bronze & Thai
แต่ที่นิยมใช้มากที่สุดจะอยู่ในรูปแบบ Bronze + Thai 
OR เป็น คำสั่งให้เลือกคำใดคำหนึ่ง หรือ ทั้งสองคำมาแสดงผล เช่น Bronze OR Thailand เว็บไซต์ค้นหา จะค้นหาหน้าเว็บไซต์ ที่มีคำว่า Domain หรือ Siam ออกมาแสดงก็ได้ ซึ่งปกติแล้ว ค่าเริ่มต้นของทุก เว็บค้นหา จะเป็น OR อยู่แล้ว วิธีใช้คำสั่งจะสามารถใช้ได้หลายรูปแบบดังนี้
Bronze OR Thailand, Bronze Thailand
แต่ที่นิยมมากที่สุดจะอยู่ในรูปแบบ Bronze Thailand 
NOT เป็นคำสั่งให้ตัดเว็บไซต์ที่มีคำค้นหา ตามหลัง NOT ออกไป เช่น Thailand NOT Bangkok เป็นคำสั่งให้ค้นหาคำว่า Thailand แต่ไม่เอาหน้าที่มีคำว่า Bangkok วิธีใช้คำสั่งจะสามารถใช้ได้หลายรูปแบบดังนี้
Thailand NOT Bangkok, Thailand -Bangkok
แต่ที่นิยมมากที่สุดจะอยู่ในรูปแบบ Thailand -Bangkok
ซึ่ง หากเรานำคำสั่งต่าง ๆ เหล่านี้มาประยุกต์ใช้กับคำค้นหาเรา ก็จะทำให้เราสามารถค้นหาเว็บที่ให้ข้อมูลได้ตรงกับความต้องการภายในเวลารวด เร็ว


web search engine ของไทย



















web search engine ของต่างประเทศ

สัดส่วนของผู้ใช้ในสหรัฐอเมริกา (ข้อมูลจาก นิตยสารฟอรบส์ ฉบับวันที่ 18 กรกฎาคม พ.ศ. 2548)
1. กูเกิล (Google) 36.9%
2. ยาฮูเสิร์ช (Yahoo! Search) 30.4%
3. เอ็มเอสเอ็นเสิร์ช (MSN Search) 15.7%

นอกจากด้านบน เว็บอื่น ๆ ที่เป็นที่นิยมได้แก่
- เอโอแอล (AOL Search)
- อาส์ก (Ask)
- เอ 9 (A9)
- ไป่ตู้ (Baidu, 百度) เสิร์ชเอนจิน อันดับ 1 ของประเทศจีน



ไม่มีความคิดเห็น:

แสดงความคิดเห็น