Provided by Department of Linguistics, Chulalongkorn University.
ค้นหาคำ
ข้อความซ้าย
ข้อความขวา
เรียงตาม
บริบทขวา
บริบทซ้าย
คำค้น
ไม่เรียง
ไม่นำหน้าด้วย
และไม่ตามหลังด้วย
ค้นตาม
ตัวอักษร
ตัวอักษร+กฎ
ค้นจากคลังข้อมูล :
==ข้อมูลเฉพาะทาง==
บทบรรณาธิการ
จดหมายราชการ
บทสัมภาษณ์จากนิตยสาร
รัฐธรรมนูญ 2540
กฎหมายแพ่งและพาณิชย์
กฎหมายอาญา
ข่าวหนังสือพิมพ์ออนไลน์
วารสารวิชาการ
นวนิยาย
==ข้อมูลภาษาไทยถิ่น==
ไทยกรุงเทพ
ไทยถิน่กลาง
ไทยถิน่เหนือ
ไทยถิน่อีสาน
ไทยถิน่ใต้
======
ข่าว
นสพ.กรุงเทพธุรกิจ
นสพ.กรุงเทพธุรกิจ2
นสพ.ไทยรัฐ
บทความทั่วไป
นิตยสาร สารคดี
ภาษาเก่า
เรื่องสั้น นิยาย
บทความวิชาการ
กฎหมาย (บางส่วน)
กฎหมาย (ทั้งหมด)
สุนทรพจน์นายกฯทักษิณ
สุนทรพจน์นายกฯชวน
บทสนทนา
จำนวนไม่เกิน
5 ตัวอย่าง
20 ตัวอย่าง
50 ตัวอย่าง
200 ตัวอย่าง
500 ตัวอย่าง
1000 ตัวอย่าง
คลังข้อมูลภาษาไทยแห่งชาติ (Thai National Corpus)
เปิดให้บริการแล้ว (ข้อมูล 33 ล้านคำ)
จากคลังข้อมูลภาษาไทยที่รวบรวมไว้นี้ เราสามารถค้นหาตัวอย่างของการใช้ภาษาไทยที่เกิดขึ้นจริง เช่น เราอาจต้องการรู้ว่าคำว่า "ปฏิรูป" มีการใช้กับเรื่องใดได้บ้าง ใช้ในบริบทและความหมายใดบ้าง หรือเราอาจสงสัยว่าคำว่า "ของ" (ซึ่งหมายถึง "แห่ง") และคำว่า "แห่ง" (ซึ่งหมายถึง "ของ") จริงๆมีการใช้แตกต่างกันอย่างไร คลังข้อมูลภาษาเหล่านี้จะช่วยให้ข้อมูลสำหรับตอบคำถามเหล่านี้ได้ เพียงแค่พิมพ์คำหรือวลีที่ต้องการค้น เลือกคลังข้อมูลและบอกจำนวนตัวอย่างที่ต้องการ เราก็จะได้เห็นตัวอย่างจริงของการใช้คำหรือวลีนั้นที่พบในคลังข้อมูลที่เลือก
สามารถกำหนดบริบทซ้ายและขวาได้มากที่สุดไม่เกิน 1000 ตัวอักษร ค่าเริ่มต้นเป็น 200 ทั้งสองข้าง
สามารถกำหนดไม่ให้ดึงข้อมูลที่มีคำที่ไม่ต้องการอยู่ข้างหน้าหรือตามหลังคำค้นก็ได้ เช่น เมื่อ ค้น "ความแตก" ที่ไม่ตามหลังด้วย "ต่าง,แยก,ตื่น" ก็จะไม่ได้ ความแตกต่าง ความแตกตื่น ความแตกแยก แต่จะได้คำเช่น ความแตกร้าว ความแตกตัว เป็นต้น
เลือกค้นตามตัวอักษร เช่น เมื่อหาคำว่า "ลิ" จะได้ทุกคำที่มี "ลิ" ประกอบอยู่ เช่น "ลิบ" "ลิ้น" "เลิก" (สามารถค้นโดยใช้รูปแบบ
regular expression
ได้ในโหมดนี้)
เลือกค้นตามตัวอักษร+กฎ จะได้คำที่แคบลง เพราะใช้กฎทางอักขรวิธีช่วย เช่น เมื่อหาคำว่า "ลิ" จะไม่ได้คำ "เลิก" "ลิ้น" แต่จะได้คำว่า "ลิ" "ลิบ"
คลังข้อมูลภาษาไทยที่สามารถสืบค้นได้มีดังนี้
ข้อมูลภาษาเฉพาะทาง - เป็นข้อมูลที่มีจำนวนไม่มากนัก แต่จัดแยกตามประเภทตัวบทเพื่อประโยชน์ในการศึกษาภาษาเฉพาะทาง ข้อมูลได้จากศ.ดร.อมรา ประสิทธิรัฐสินธุ์
ข้อมูลภาษาไทยถิน - เป็นข้อมูลที่จัดแยกตามถิ่นต่าง ๆ ข้อมูลได้จากศ.ดร.อมรา ประสิทธิรัฐสินธุ์
ข่าว - เป็นข้อมูลข่าวจากสำนักข่าวไทยช่วงระหว่าง มิ.ย. 2535 - พ.ค. 2537 (ขนาด 5,353,000 คำ)
นสพ.กรุงเทพธุรกิจ - เป็นข้อมูลข่าว คอลัมน์ และบทความต่างๆในหนังสือพิมพ์กรุงเทพธุรกิจบนอินเทอร์เน็ต 13 เดือน ตั้งแต่ พ.ย. 2542 - พ.ย. 2543 (ขนาด 29,503,000 คำ)
นสพ.กรุงเทพธุรกิจ2 - เป็นข้อมูลข่าว คอลัมน์ และบทความต่างๆในหนังสือพิมพ์กรุงเทพธุรกิจบนอินเทอร์เน็ต 1 ปี ตั้งแต่ ม.ค. 2545 - ธ.ค. 2545 (ขนาด 23,455,000 คำ)
นสพ.ไทยรัฐ - เป็นข้อมูลข่าวจากหนังสือพิมพ์ไทยรัฐบนอินเทอร์เน็ต 1 ปี ตั้งแต่ ก.ค. 2543 - มิ.ย. 2544 (ขนาด 6,179,000 คำ)
บทความทั่วไป - เป็นข้อมูลจากคอลัมน์ทั่วไปในหนังสือพิมพ์กรุงเทพธุรกิจบนอินเทอร์เน็ต (จุดประกาย,กาแฟดำ,จับกระแส,บทบก.) ระหว่าง ก.ค. - ก.ย. 2542 (ขนาด 607,000 คำ)
นิตยสาร สารคดี - เป็นบทความจากนิตยสาร สารคดี ที่เผยแพร่บนอินเทอร์เน็ต ตั้งแต่ ม.ค. 2542 - พ.ย. 2545 (ขนาด 1,292,000 คำ)
ภาษาเก่า - เป็นข้อมูลภาษาไทยเก่า ประกอบด้วย ไตรภูมิพระร่วง, จดหมายเหตุรัชกาลที่ 3, พระราชหัตเลขารัชกาลที่ 5, ชุมนุมพระบรมราชาธิบายรัชกาลที่ 5 (ขนาด 99,750 คำ)
เรื่องสั้น นิยาย - เป็นข้อมูลเรื่องสั้น(แปล)และนิยายสี่แผ่นดิน จาก web
Siam Story
เมื่อ 14 พ.ค.2545 (ขนาด 797,900 คำ)
บทความวิชาการ - เป็นข้อมูลบทความ บทสนทนา ทางวิชาการจาก web
มหาวิทยาลัยเที่ยงคืน
เมื่อวันที่ 5 มิ.ย. 2547 (ขนาด 3,476,000 คำ)
กฎหมาย (บางส่วน) - เป็นข้อมูลรัฐธรรมนูญ ประมวลกฎหมาย พระราชกฤษฎีกา พระราชบัญญัติ พระราชกำหนด กฎมณเฑียรบาล กฏบัตรสหประชาชาติ คำสั่ง ประกาศ ข้อบังคับ ข้อกำหนด กฎกระทรวง ระเบียบ ตรา รวม 3771 ฉบับจาก web ของสำนักงานคณะกรรมการกฤษฎีกา
www.krisdika.go.th
(ขนาด 5,204,000 คำ)
กฎหมาย (ทั้งหมด) - เป็นข้อมูลกฎหมายจาก Thai-Law corpus v0.1 (PyThaiNLP/thai-law) ซึ่งรวบรวมจากเว็บ สำนักงานคณะกรรมการกฤษฎีกา
ประมวลสุนทรพจน์ของนายกรัฐมนตรี พ.ต.ท.ทักษิณ ชินวัตร (รวมรายการนายกฯทักษิณคุยกับประชาชน) ตั้งแต่ 2544 - ส.ค. 2547
www.thaigov.go.th
(ขนาด 880,300 คำ)
ประมวลสุนทรพจน์ของนายกรัฐมนตรี ชวน หลีกภัย ตั้งแต่
2540 - 2543
www.thaigov.go.th
(ขนาด 109,600 คำ)
บทสนทนา เป็นข้อมูลถอดเทปจากรายการจ.ส.100 และจากการบรรยายเรื่อง"ในหลวงกับภาษาไทย" (82,900 คำ)
หมายเหตุ
Web site นี้สร้างขึ้นมาเพื่อประโยชน์ด้านการศึกษา เพื่อให้นิสิตนักศึกษาที่สนใจภาษาไทยสามารถค้น หารูปแบบต่างๆของการใช้ภาษาไทยที่เกิดขึ้นจริง
ตัวบทจากหมวด'บทความทั่วไป' และ
'นสพ.กรุงเทพธุรกิจ'
เป็นลิขสิทธิ์ของบริษัทเนชั่นมัลติมีเดีย กรุ๊ป จำกัด (มหาชน), ตัวบทจากหมวด
'นสพ.ไทยรัฐ'
เป็นเป็นลิขสิทธิ์ของบริษัทวัชรพล จำกัด, ตัวบทจากหมวด
'นิตยสาร สารคดี'
เป็นลิขสิทธิ์ของสำนักพิมพ์สารคดี ตัวบทจากภาษาเก่าได้รับอนุเคราะห์ตัวบทจาก ศ.ดร.ปราณี กุลละวณิชย์, ข้อมูลกฎหมายรวบรวมโดยนายยุทธชัย วิธีกล, บทสนทนาได้จากอ.ดร.สุดา รังกุพันธุ์
ผู้ใช้ไม่สามารถเรียกดูตัวบททั้งหมดของบทความได้ โปรแกรม concordance นี้จะแสดงผลเฉพาะบรรทัดที่มีรายการคำหรือวลีที่ค้นเท่านั้น และห้ามมิให้นำผลที่ได้นี้ไปใช้เพื่อแสวงหาประโยชน์อื่นใดโดยไม่ได้รับคำยินยอมจากเจ้าของลิขสิทธิ์ นอกจากใช้เพื่อศึกษาภาษาไทย
หากต้องการใช้โปรแกรม Thai concordance กับข้อมูลส่วนตัวอื่นๆ สามารถ download โปรแกรม
Thai Concordance Version 1.25 (Win9x)
ซึ่งสามารถใช้กับ plain text และ HTML files และสามารถค้นหาโดยกำหนดขอบเขตพยางค์ได้
Created by Wirote Aroonmanakun. Copyrights 1999.