ถาม-ตอบปัญหา

คลังข้อมูลภาษาคืออะไร ?

ข้อมูลภาษาเขียนหรือภาษาพูดที่เป็นภาษาที่ใช้จริงซึ่งถูกรวบรวมขึ้นมาในปริมาณที่มากเพียงพอตามเงื่อนไขที่กำหนดเพื่อให้ได้คลังข้อมูลที่เป็นตัวแทนของภาษาที่ต้องการ และสามารถนำคลังข้อมูลนั้นมาใช้ประโยชน์ในการศึกษาเรื่องต่างๆที่เกี่ยวข้องกับภาษา ในปัจจุบันเมื่อกล่าวถึงคลังข้อมูลภาษาจะหมายถึงข้อมูลภาษาที่มีการเก็บบันทึกไว้ในคอมพิวเตอร์ซึ่งทำให้ค้นหาได้โดยสะดวก

ขนาดของคลังข้อมูลมีความสำคัญอย่างไร

ขนาดของคลังข้อมูลเป็นปัจจัยสำคัญที่ต้องคำนึงถึงเวลาสร้างคลังข้อมูลภาษา ไม่ว่าขนาดของคลังข้อมูลภาษาจะใหญ่เพียงใดก็ตาม ในความเป็นจริงก็เป็นเพียงส่วนเล็กน้อยมากเมื่อเทียบกับจำนวนของภาษาที่เกิดขึ้นทั้งหมด (หากลองนึกถึงปริมาณประโยคที่คนไทยทั้งหมดพูดและเขียนในแต่ละวัน) หากเราต้องการรู้ว่าคลังข้อมูลภาษาขนาดหนึ่งล้านคำ สิบล้านคำหรือร้อยล้านคำนั้นจริงๆแล้วเป็นข้อมูลภาษาที่มากน้อยเพียงใด เราก็สามารถทำได้ง่ายๆโดยการสุ่มตัวอย่างหน้าหนังสือเล่มหนึ่ง แล้วนับจำนวนคำที่ปรากฏในหน้าหนังสือนั้น ตัวอย่างเช่น ในหนังสือเล่มหนึ่ง มีจำนวน 272 หน้า เมื่อสุ่มไปที่หน้า 81 ของหนังสือเล่มนี้มีจำนวนคำอยู่ 390 คำ หากเราถือว่าทุกๆหน้าในหนังสือเล่มนี้มีจำนวนคำที่ใกล้เคียงกัน ดังนั้นหนังสือเล่มนี้ก็จำมีจำนวนคำประมาณ 106,080 คำ ดังนั้นหากต้องการวัดขนาดคลังข้อมูลภาษาซึ่งมีขนาดหนึ่งล้านคำโดยการเปรียบเทียบกับหนังสือเล่มนี้ ก็จะสามารถคำนวณได้ว่ามีขนาดเท่ากับหนังสือเล่มนี้โดยประมาณ 9.4 เล่ม หรือถ้าเป็นคลังข้อมูลขนาด 100 ล้านคำก็ประมาณว่ามีขนาดเท่ากับหนังสือนี้ 940 เล่ม ดังนั้นจะเห็นได้ว่าคลังข้อมูลภาษาเป็นเพียงการสุ่มตัวอย่างจากภาษาที่เกิดขึ้นจริงจำนวนหนึ่งเท่านั้น โดยหลักแล้วจึงควรรวบรวมข้อมูลให้ได้มากเท่าที่สุดเท่าที่จะสามารถทำได้

คลังข้อมูลภาษามีประโยชน์อย่างไร

ประโยชน์ในด้านการเรียนการสอนภาษา

ทั้งอาจารย์และนักเรียนที่สนใจภาษาสามารใช้คลังข้อมูลภาษาเป็นทรัพยากรที่สามารถตอบข้อสงสัยในเรื่องการใช้ภาษาได้ง่ายขึ้น เช่น เมื่อมีข้อสงสัยว่าคำหรือวลีที่สงสัยว่าสามารถใช้ได้หรือไม่ ก็สามารถตรวจสอบจากคลังข้อมูลภาษานี้ได้โดยตรง หากมีการใช้จริง ก็จะเห็นด้วยว่ามีการใช้เป็นจำนวนมากหรือน้อยเพียงใด บริบทการใช้ควรเป็นเช่นใด

ประโยชน์ในด้านการเขียนตำราไวยากรณ์หรือหนังสืออ้างอิงต่างๆ

ผลจากการศึกษาข้อมูลจริงทำให้เห็นกันมากขึ้นว่า บางครั้งกฎไวยากรณ์ต่างๆที่สอนกันมานั้นอาจเปลี่ยนแปลงไปแล้ว การศึกษาจากคลังข้อมูลภาษาจึงมีส่วนช่วยในการปรับปรุงตำราไวยากรณ์ต่างๆให้ทันสมัยขึ้น ในภาษาอังกฤษมีการใช้ประโยชน์จากคลังข้อมูลภาษาเพื่อปรับปรุงเนื้อหาหนังสือและตำรา เช่น Longman Grammar of Spoken and Written English, หนังสือในชุด English Vocabulary in Use, Vocabulary in Practice, และ Grammar in Context ของสำนักพิมพ์เคมบริดจ์ ในภาษาไทย  เราก็หวังว่าจะมีผู้ทำสิ่งเหล่านี้ขึ้น หลังจากคลังข้อมูลภาษาไทยแห่งชาติได้เผยแพร่แก่สาธารณะแล้ว

ประโยชน์ในด้านการทำพจนานุกรม

การนำคลังข้อมูลภาษาสามารถช่วยให้ผู้ทำพจนานุกรมเห็นขอบเขตของความหมายต่างๆของคำได้คลอบคลุมและชัดเจนมากขึ้น ทำให้สามารถเข้าถึงความหมายใหม่ๆโดยมีหลักฐานจากการใช้ที่มีการปรากฏจริงอยู่ในตัวบท นอกจากนี้ในปัจจุบันพจนานุกรมที่จัดทำโดยไม่อาศัยคลังข้อมูลภาษาจะไม่ได้รับการยอมรับและเชื่อถือมากเท่าพจนานุกรมที่จัดทำโดยใช้คลังข้อมูลภาษา เช่น Collin Cobuild Dictionary ใช้ข้อมูลจาก The Bank of English, Longman Dictionary of American English ใช้ข้อมูลจาก The Longman Corpus network, Cambridge Dictionary of American English ใช้ข้อมูลจาก Cambridge International corpus ฯลฯ การทำพจนานุกรมไทยในอนาคตจึงจำเป็นต้องอาศัยคลังข้อมูลภาษาไทยแห่งชาตินี้เป็นพื้นฐาน

ประโยชน์ในด้านการทำงานวิจัยทางภาษาศาสตร์

ปัจจุบันนักภาษาศาสตร์หันมาใช้คลังข้อมูลภาษาในการศึกษาปรากฏการณ์ต่างๆทางภาษากันมากขึ้น เพราะจะทำให้ผู้วิจัยได้เห็นถึงโครงสร้างและการใช้ภาษาได้ดีขึ้น ซึ่งแต่เดิมการอธิบายเกี่ยวกับโครงสร้างภาษาจะเป็นไปแบบดั้งเดิมที่ไม่ได้ใช้การวิจัยเชิงประจักษ์และยึดติดกับการนึกรู้เอง (intuition) ในฐานะเป็นเจ้าของภาษาของผู้วิจัย ผู้วิจัยสามารถนำคลังข้อมูลภาษามาช่วยในการวิเคราะห์ภาษาได้ในหลายระดับและหลายแง่มุม เช่นการศึกษาเรื่องคำ การศึกษาไวยากรณ์ที่เน้นเรื่องคำและหน่วยคำ การศึกษาไวยากรณ์ที่เน้นเรื่องประโยคเช่น การศึกษาความยาวของประโยค การศึกษากระบวนการทางไวยากรณ์ นอกจากนี้นักวิจัยยังสามารถนำคลังข้อมูลมาศึกษาภาษาในแง่มุมของวัจนกรรมประเภทต่างๆ และการศึกษาการแปรของภาษา เป็นต้น

ตัวอย่างคลังข้อมูลภาษาของภาษาอื่นๆมีอะไรบ้าง

British National Corpus (100 ล้านคำ แล้วเสร็จในปี ค.ศ.1994 ), The Bank of English (ปัจจุบันมีมากกว่า 450 ล้านคำ), American National Corpus (เป้าหมาย 100 ล้านคำ ปัจจุบันเก็บได้ 22 ล้านคำ), Czech National Corpus, Hellenic National Corpus (คลังข้อมูลภาษากรีก ปัจจุบันมีมากกว่า 34 ล้านคำ), National Corpus of Irish (30 ล้านคำ แล้วเสร็จในปี ค.ศ.1999), Hungarian National Corpus (มากกว่า 150 ล้านคำ), Slovak National Corpus (30 ล้านคำในปัจจุบัน), Croatian National Corpus ฯลฯ

คลังข้อมูลภาษาไทยแห่งชาติคืออะไรและมีความสำคัญอย่างไรต่อภาษาไทย

คลังข้อมูลภาษาไทยแห่งชาติ (TNC) คือข้อมูลภาษาไทยมาตรฐานจำนวนมากที่ถูกเก็บรวบรวมลงในคอมพิวเตอร์อย่างเป็นระบบ ตามหลักเกณฑ์การคัดเลือกข้อมูลที่ชัดเจน เพื่อให้ได้ข้อมูลที่จะสามารถใช้เป็นตัวแทนของการใช้ภาษาไทยปัจจุบันในลักษณะต่างๆ และมีการกำกับข้อมูล (markup) ในลักษณะต่างๆตามมาตรฐานสากลเพื่อให้สามารถสืบค้นทางคอมพิวเตอร์ได้โดยสะดวก คลังข้อมูลภาษาไทยแห่งชาตินี้ เมื่อใช้ร่วมกับโปรแกรมสืบค้นข้อมูลภาษาไทยที่จะจัดทำขึ้นจะเป็นทรัพยากรที่สำคัญในการศึกษาภาษาไทย ทำให้ผู้ที่อยู่ในแวดวงการศึกษาภาษาไทยสามารถเข้าถึงและศึกษาภาษาไทยได้อย่างลึกซึ้ง และเป็นประโยชน์อย่างยิ่งต่อการจัดทำพจนานุกรมภาษาไทย เพราะทำให้สามารถปรับปรุงเปลี่ยนแปลงนิยามคำให้สอดคล้องกับการเปลี่ยนแปลงของภาษาได้โดยง่าย นอกจากนี้ ยังเป็นแหล่งอ้างอิงสำหรับนักเรียนและอาจารย์ผู้สอนภาษาไทยทั้งในและต่างประเทศ

คลังข้อมูลภาษาไทยแห่งชาติมีโครงสร้างอย่างไร

คลังข้อมูลภาษาไทยแห่งชาติได้รับการออกแบบเพื่อครอบคลุมภาษาไทยในลักษณะต่างๆให้ได้มากที่สุดเพื่อเป็นตัวแทน (representative) ของภาษาไทยมาตรฐานในปัจจุบัน และเพื่อให้สะดวกต่อการศึกษาเปรียบเทียบกับภาษาอื่น จึงวางโครงสร้างล้อไปกับคลังข้อมูลภาษาที่เป็นที่รู้จักและใช้กันแพร่หลายคือ British National Corpus แต่ก็มีการปรับรายละเอียดให้เหมาะสมกับลักษณะเฉพาะของงานเขียนภาษาไทย ดังนั้น ข้อมูลภาษาทั้งหมดในคลังข้อมูลมาจากภาษาเขียน ซึ่งประกอบด้วยข้อมูลภาษาเขียนที่มีเนื้อหา (domain) เป็นแนวสาระ (informative) ร้อยละ 75 และแนวจินตนาการหรืองานประพันธ์ (imaginative) ร้อยละ 25 ที่มาของตัวอย่างภาษานั้นมากจากงานเขียนที่หลากหลายโดยใช้เกณฑ์คัดเลือกจากมุมมองหลายมิติร่วมกันได้แก่ เกณฑ์สื่อ เกณฑ์เวลา และเกณฑ์ย่อยอื่นๆอีกเช่น ขนาดของงานเขียนและขอบเขต (จุดเริ่มและจุดสุดท้าย) หัวข้อของงานเขียน อายุ เพศ และภูมิลำเนาของผู้แต่ง อายุและเพศของกลุ่มเป้าหมาย เป็นต้น และยังมีการแยกประเภทย่อยของงานเขียนตามลักษณะรูปแบบการเขียน เช่น งานเขียนวิชาการประเภทต่างๆ งานเขียนกึ่งวิชาการเรื่องต่างๆ งานเขียนอัตชีวประวัติ รายงานข่าวต่างๆ บทความวารสารทั่วไป ข่าวซุบซิบบันเทิง จดหมาย เรียงความ นิยาย งานเขียนศาสนาปรัชญา เอกสารทางการ เป็นต้น

คลังข้อมูลภาษาไทยแห่งชาติมีการคัดเลือกตัวอย่างข้อมูลภาษาไทยอย่างไร

เกณฑ์ที่ใช้ในเลือกข้อมูลจึงคล้ายคลึงกับเกณฑ์ที่ BNC ใช้ โดยใช้เกณฑ์ในการควบคุมการคัดเลือกข้อมูลภาษาเขียน คือ เนื้อหา (domain) เวลาที่สร้างงานเขียน (time) และสื่อที่ใช้นำเสนอ (medium) และเพื่อให้ได้ความหลากหลายของงานเขียน แต่ละงานเขียนที่เลือกมาจะสุ่มข้อความต่อเนื่องมาไม่เกิน 40,000 คำ เนื้อหา : เป็นเกณฑ์ที่ใช้เพื่อแยกประเภทของงานเขียน โดยกำหนดให้ 75% ของงานเขียนเป็นแนวด้านสาระ (informative) ซึ่งเลือกจากสาขาต่างๆเช่น วิทยาศาสตร์ วิทยาศาสตร์ประยุกต์ สังคมศาสตร์ ศิลปะและมนุษยศาสตร์ ศาสนาและความเชื่อ การเงินการพาณิชย์ เรื่องระหว่างประเทศ นันทนาการ และอีก 25% ของงานเขียนเป็นงานประพันธ์ (imaginative) ซึ่งคืองานด้านวรรณกรรมและบทกวี

สื่อ : เป็นเกณฑ์ที่ใช้เพื่อแยกประเภทของงานเขียนที่ปรากฏในสื่อประเภทต่างๆ โดยกำหนดให้ 60% ของงานเขียนเป็นหนังสือ 20% เป็นวารสาร และหนังสือพิมพ์ อีก 5-10% มาจากสิ่งพิมพ์อื่นๆ เช่น แผ่นพับ แผ่นโฆษณา อีก 5-10% มาจากงานเขียนที่ไม่ตีพิมพ์ เช่น จดหมายส่วนตัว บันทึกประจำวัน เรียงความ และบันทึกช่วยจำ และอีกน้อยกว่า 5% เก็บจากงานเขียนเผยแพร่บนอินเทอร์เน็ต

เวลา : เป็นเกณฑ์ที่ใช้เพื่อเก็บงานเขียนที่เป็นตัวแทนของภาษาปัจจุบัน โดยกำหนดให้เป็นงานเขียนในช่วง พ.ศ.2541-2550 เป็นหลัก และยอมให้มีงานเขียนในช่วง พ.ศ.2531-2540 ได้ไม่เกิน 10% ยกเว้นในกรณีของงานแต่งเช่น นิยาย ที่ยอมให้เก่ากว่านั้นได้ แต่มีข้อแม้ว่าต้องเป็นงานที่มีการตีพิพม์ซ้ำในช่วงพ.ศ. ที่กล่าวมา

ประเภทงานเขียนเป็นเกณฑ์ที่ใช้กำหนดประเภทงานแต่ละชิ้นที่ได้มา ซึ่งไม่ได้กำหนดสัดส่วนไว้ตายตัว แต่กำหนดขึ้นเพื่อเป็นเป้าหมายว่าในคลังข้อมูลภาษาไทยแห่งชาติควรจะมีงานเขียนทุกประเภทที่กำหนดนี้ในจำนวนพอสมควร ประเภทงานเขียนที่กำหนดไว้เบื้องต้น เช่น งานวิชาการ งานกึ่งวิชาการ การบริหาร โฆษณา ชีวประวัติ ข่าว บทความนิตยสาร กฎหมาย คู่มือ จดหมาย เรียงความ เป็นต้น

นอกจากเกณฑ์หลักทั้งสี่แล้ว ยังมีเกณฑ์ย่อยอื่นๆอีก ซึ่งไม่ได้กำหนดกฎเกณฑ์ไว้ตายตัวว่าต้องเป็นเช่นไร เพียงแค่พยายามให้มีความหลากหลายเท่าที่จะเป็นไปได้ ในเกณฑ์นั้น ๆ เช่น ขนาดของงานเขียนและขอบเขต (จุดเริ่มและจุดสุดท้าย) หัวข้อของงานเขียน อายุ เพศ และภูมิลำเนาของผู้แต่ง อายุและเพศของกลุ่มเป้าหมาย เป็นต้น

โครงการพัฒนาคลังข้อมูลภาษาไทยแห่งชาติมีเป้าหมายเก็บตัวอย่างข้อมูลภาษาไทยเป็นจำนวนเท่าใด

โครงสร้างคลังข้อมูลภาษาไทยแห่งชาติมีเป้าหมายรวบรวมข้อมูลภาษาไทยจำนวน 80 ล้านคำ เพื่อเฉลิมฉลองวโรกาสที่พระบาทสมเด็จพระเจ้าอยู่หัวฯ ทรงเจริญพระชนมพรรษาครบ 80 พรรษาในปี พ.ศ. 2550 และเพื่อเฉลิมพระเกียรติพระบาทสมเด็จพระเจ้าอยู่หัวฯเนื่องในวันภาษาไทยแห่งชาติ 29 กรกฎาคม 2550

ปัจจุบันมีคลังข้อมูลภาษาไทยอื่นๆ ที่สร้างเสร็จแล้วหรือไม่

มี ปัจจุบันมีหน่วยงานและสถาบันการศึกษาหลายแห่งเห็นถึงประโยชน์และได้จัดสร้างคลังข้อมูลภาษาไทยขึ้นเพื่อใช้ในงานต่างๆ ของตน แต่เนื่องจากปัญหาเรื่องลิขสิทธิ์ ทำให้ไม่สามารถเผยแพร่ข้อมูลที่จัดทำได้ มีเพียงคลังข้อมูลออร์คิดของศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) เท่านั้นที่ได้เผยแพร่แก่สาธารณะ เพราะเป็นข้อมูลของหน่วยงานเอง แต่ก็เป็นข้อมูลขนาดเล็ก (4 แสนคำ) และเป็นงานเขียนวิชาการประเภทเดียว นอกจากนี้ ก็มีคลังข้อมูลภาษาไทยที่ภาควิชาภาษาศาสตร์ จุฬาฯ ได้รวบรวมจากแหล่งต่างๆ เช่น หนังสือพิมพ์ สุนทรพจน์ รายงานข่าว บทความวิชาการ นิยายและเรื่องสั้น และเปิดให้บริการสืบค้นข้อมูลภาษาไทยผ่านทางอินเทอร์เน็ต แต่ก็เป็นข้อมูลที่จัดเก็บตามสะดวก ไม่ครอบคลุมการใช้ภาษาในลักษณะต่างๆ อย่างเป็นระบบ และลิขสิทธิ์ของงานเขียนต่างๆยังคงเป็นของสำนักพิมพ์และผู้เขียน จึงไม่สามารถเผยแพร่ตัวคลังข้อมูลทั้งหมดแก่สาธารณะได้ การจัดทำคลังข้อมูลภาษาไทยขนาดใหญ่อย่างเป็นระบบเพื่อเป็นข้อมูลแทนภาษาไทยมาตรฐานในปัจจุบันจึงเป็นสิ่งจำเป็น และจะเป็นการกระตุ้นให้เกิดความตื่นตัวต่อการศึกษาภาษาไทยอย่างกว้างขวาง

ใครสามารถเข้าไปใช้คลังข้อมูลภาษาไทยแห่งชาติได้บ้าง

โครงการนี้เป็นโครงการในพระราชูปถัมภ์สมเด็จพระเทพรัตนราชสุดาฯ หลังจากโครงการสิ้นสุดแล้ว จะนำทูลเกล้าถวายสมเด็จพระเทพรัตนราชสุดาฯ และคาดว่าจะสามารถเปิดให้บริการแก่สาธารณะ และจะดำเนินการให้มีการใช้งานอย่างแพร่หลาย

ท่านสามารถมีส่วนร่วมในการสร้างคลังข้อมูลภาษาไทยแห่งชาติได้อย่างไร

โครงการต้องการรวบรวมงานเขียนต่างๆ ให้หลากหลายและครอบคลุมภาษาไทยมาตรฐานให้มากที่สุด จึงจำเป็นต้องอาศัยงานเขียนจากบุคคลจำนวนมากซึ่งไม่จำกัดว่าจะต้องเป็นนักประพันธ์ นักวิชาการที่มีชื่อเสียงเท่านั้น แต่บุคคลทั่วไปในช่วงอายุต่างๆ ไม่ว่าจะเป็นเด็ก ผู้ใหญ่ หากเป็นคนไทยโดยกำเนิดและเติบโตในประเทศไทยก็สามารถส่งงานเขียนให้กับโครงการเพื่อคัดเลือกลงในคลังข้อมูลได้ เพราะการคัดเลือกงานเขียนประเภทต่างๆ รวมถึงการติดต่อขออนุญาตนำข้อมูลงานเขียนมาลงในคลังข้อมูลเป็นงานที่ใช้เวลามากหากโครงการต้องดำเนินการโดยลำพัง ดังนั้น หากท่านเห็นความสำคัญของโครงการนี้ หากท่านประสงค์จะเป็นผู้หนึ่งที่มีงานเขียนจัดเก็บในคลังข้อมูลภาษาไทยแห่งชาตินี้ ท่านก็สามารถช่วยเหลือโครงการด้วยการส่งงานเขียนของท่านมาเพื่อให้พิจารณาหรือชักจูงบอกกล่าวบุคคลอื่นให้ส่งงานเขียนให้กับโครงการ

งานเขียนประเภทใดที่เหมาะสมที่จะส่งให้กับโครงการ

งานเขียนที่โครงการรวบรวมไม่ได้จำกัดว่าต้องเป็นงานประพันธ์ที่ได้รับการตีพิมพ์เผยแพร่ หรือเป็นงานเขียนที่รู้จักแพร่หลาย ขอเพียงท่านมีงานเขียนซึ่งเป็นภาษาไทยที่สามารถเผยแพร่ได้ อาจเป็นงานที่เคยตีพิมพ์มาแล้ว หรือเป็นงานที่ไม่ได้ตีพิมพ์แต่เผยแพร่ในรูปแบบอื่น เช่น เป็นจดหมายส่วนตัว เป็นบันทึกประจำวัน เป็นแผ่นพับ เป็นเรียงความในชั้นเรียน เป็นอีเมล์ ฯลฯ คืองานทุกอย่างที่เป็นการเขียน ท่านก็สามารถส่งงานเขียนของท่านมาให้กับโครงการได้ เพราะโครงการต้องการรวบรวมตัวอย่างของภาษาเขียนให้ครอบคลุมภาษาเขียนทุกประเภท จากบุคคลต่างๆ ทุกเพศ ทุกวัย

หากสนใจจะส่งผลงานเข้าเป็นส่วนหนึ่งของคลังข้อมูลภาษาไทยแห่งชาติต้องทำอย่างไรบ้าง

เพื่ออำนวยความสะดวกให้กับทางโครงการ หากท่านมีข้อมูลที่พิมพ์เก็บไว้เป็นไฟล์แล้วในรูปของ MS Word หรือเป็น plain text ท่านก็สามารถส่งงานนั้นมาทางอีเมล์ โดยส่งเป็นไฟล์แนบมาที่ tnc@chula.ac.th พร้อมทั้งให้ข้อมูลตามรูปแบบนี้

ข้อมูลงานเขียน :
ชื่องาน _________________________________________ เขียนเมื่อ พ.ศ. ______
เป็นงานเขียนจาก ___________________________________________________
หากมีการตีพิมพ์ กรุณาให้ข้อมูล :
(1) ชื่อหนังสือ/วารสารที่พิมพ์ ____________ พิมพ์ครั้งที่ _____ บรรณาธิกร_______
หน้าที่ ________ พิมพ์ที่ _________ จังหวัด _______________________________
(2) เผยแพร่ทางอินเทอร์เน็ตที่ ___________________________________________
ข้อมูลผู้เขียน :
ผู้เขียน ____________________ เพศ ชาย/หญิง ปี พ.ศ. ที่เกิด _______________
ภูมิลำเนาที่เติบโต 1. เหนือ / 2. อีสาน / 3. ใต้ / 4. กลางหรือกทม.

เมื่อได้รับงานเขียนจากท่านแล้ว ทางโครงการจะแจ้งให้ท่านทราบว่าข้อมูลงานเขียนที่ส่งมานั้นสามารถนำลงในคลังข้อมูลภาษาไทยแห่งชาติได้หรือไม่ พร้อมทั้งจะแจ้งขั้นตอนการเซ็นหนังสือยินยอมให้นำงานเขียนลงในคลังข้อมูล ซึ่งหากเป็นงานเขียนขนาดสั้น ทางโครงการอาจนำงานทั้งหมดเข้าในคลังข้อมูลหากท่านไม่ขัดข้อง แต่หากเป็นงานเขียนขนาดยาว ทางโครงการก็จะสุ่มข้อความต่อเนื่องจากงานของท่านไม่เกิน 40,000 คำ

หากส่งผลงานมาให้โครงการฯ แล้ว ลิขสิทธิ์ในผลงานยังเป็นของผู้เขียนอยู่หรือไม่

ลิขสิทธิ์ผลงานยังเป็นของผู้เขียนอยู่ คลังข้อมูลภาษาไทยแห่งชาติเพียงแต่ขออนุญาตที่จะนำส่วนหนึ่งของผลงานเข้าไวในคลังข้อมูลเท่านั้น และการสืบค้นข้อมูลโดยหลักก็เป็นการแสดงผลในรูปของคำที่ค้นพร้อมบริบทข้อความซ้ายขวาจำนวนหนึ่งเท่านั้น ท่านจึงไม่ต้องวิตกเรื่องการนำงานเขียนของท่านไปใช้ประโยชน์อื่นที่จะทำให้ท่านเสียประโยชน์ใดๆ และงานเขียนแต่ละชิ้นก็จะมีข้อมูลบรรณานุกรมกำกับให้ผู้ใช้รู้ว่าเป็นงานที่คัดลอกมาจากที่ใด ใครเป็นผู้เขียน