การประชุมวิชาการระดับชาติมหาวิทยาลัยทักษิณ 2559 - page 267

266
4. รายการคาหยุ
ด (Stop Words) คื
อ คาที่
ใช้
กั
นโดยทั่
วไปไม่
มี
ความหมายสาคั
ญต่
อเอกสาร ส่
วนมากจะเป็
นคา
ประเภท คาบุ
พบท คาสั
นธาน คาสรรพนามและคาวิ
เศษณ์
เช่
น จึ
ง ดั
งนั้
น อย่
างนี้
เป็
นต้
น เพื่
อนามาใช้
อ้
างอิ
งใน
กระบวนการกาจั
ดคาหยุ
ด ซึ่
งรายการคาหยุ
ดทั้
งหมด 996 คา
5. การตั
ดคา (Word Segmentation) [9] คื
อ ส่
วนของการแบ่
งข้
อความหรื
อสายอั
กขระของตั
วอั
กษรที่
ต่
อเนื่
องกั
นออกเป็
นหน่
วยคา (Morpheme) เพื่
อหาขอบเขตของแต่
ละหน่
วยคา [10] งานวิ
จั
ยนี้
ได้
ทาการตั
ดคาโดยอ้
างอิ
จากพจนานุ
กรมกฎหมาย
6. กาจั
ดคาหยุ
ด (Stop Word Removal) [11] เป็
นการนาคาที่
ไม่
มี
นั
ยสาคั
ญออก โดยที่
ไม่
ทาให้
ความหมายของ
เอกสารเปลี่
ยนแปลง ซึ่
งคาที่
ไม่
มี
นั
ยสาคั
ญในที่
นี้
หมายถึ
งคาที่
ใช้
กั
นโดยทั่
วไปไม่
มี
ความหมายสาคั
ญต่
อเอกสาร เมื่
อตั
ดออก
จากเอกสารแล้
วไม่
ทาให้
ใจความของเอกสารเปลี่
ยนแปลง เช่
น คาบุ
พบท คาสั
นธาน และคาสรรพนาม เป็
นต้
User
Section Query
Query Reformulation
Searching by
Vector Space Model
LegalDatabase
Section
Word Segmentation
Stop Words Removal
Indexing
Section Query
StopWords
Legal Dictionary
Stop Words
Legal Terms
Legal Contents
Tokens
Filtered Contents
Section with the highest
Admin
Similarity Score
Searching by Section
Section
LegalIndex
Index File
Index File
Update Legal Database
Sentences
Sentences
Pre-Processing
Core=Process
ภำพที่
1
สถาปั
ตยกรรมการทางานของระบบเปลี่
ยนคาค้
นจากเนื้
อความกฎหมาย โดยการใช้
แบบจาลองเวกเตอร์
สเปซ
7. การสร้
างดั
ชนี
(Indexing) มี
จุ
ดประสงค์
เพื่
อหลี
กเลี่
ยงการค้
นหาเอกสารที
ละรายการ ตั้
งแต่
เอกสารอั
นดั
บที่
หนึ่
งจนถึ
งเอกสารอั
นดั
บสุ
ดท้
ายหรื
อที่
เรี
ยกว่
า การค้
นหาแบบเรี
ยงลาดั
บ (Sequential Search) หรื
อการสแกนแบบ
เส้
นตรง (Linear Scanning) ซึ่
งเป็
นวิ
ธี
การที่
เสี
ยเวลาและไม่
มี
ประสิ
ทธิ
ภาพ ดั
งนั้
น การทาดั
ชนี
จึ
งช่
วยลดเวลาในการค้
นหา
ข้
อมู
ลที่
ต้
องการ [12]
8. ดั
ชนี
กฎหมาย (Legal Index) คื
อ แหล่
งเก็
บคาสาคั
ญ เพื่
อใช้
ในการค้
นคื
นคาพิ
พากษาศาลฎี
กา โดยมี
การเรี
ยง
ตามลาดาดั
บตั
วอั
กษรและการเชื่
อมโยงไปยั
งรายการอ้
างอิ
งของเนื้
อความกฎหมายที่
มี
คาๆ นั้
นปรากฏอยู่
ส่
วนของกำรทำงำนหลั
กสำหรั
บค้
นคื
นคำพิ
พำกษำศำลฎี
กำ
ประกอบด้
วย
1. ผู้
ใช้
(User) คื
อ ผู้
ใช้
งานระบบ
2. กระบวนการประมวลผลคาค้
น (Section Query) ทาหน้
าที่
แปลงคาค้
นที่
ได้
รั
บจากผู้
ใช้
ให้
อยู่
ในรู
ปแบบ
ตรรกะของคาค้
น (Query Logic)
3. กระบวนการค้
นหา ด้
วยแบบจาลองเวกเตอร์
สเปซ (Searching By Vector Space Model) ทาหน้
าที่
ค้
นหา
คาพิ
พากษาศาลฎี
กาตามคาค้
นที่
รั
บมาจากผู้
ใช้
โดยระบบจะทาการประมวลผลเอกสาร เพื่
อสร้
างตั
วแทนเอกสารและทา
การเปรี
ยบเที
ยบหาค่
าความคล้
ายคลึ
งระหว่
างตั
วแทนคาค้
นกั
บตั
วแทนเอกสาร
4. ดั
ชนี
กฎหมาย (Legal Index) คื
อ แหล่
งเก็
บข้
อมู
ลเกี่
ยวกั
บตั
วบ่
งชี้
หรื
อระบุ
ลาดั
บมาตราของสารสนเทศ
ทางด้
านประมวลกฎหมายแพ่
งและพาณิ
ชย์
และคาพิ
พากษาศาลฎี
กา
5. ฐานข้
อมู
ลกฎหมาย (Legal Database) คื
อ แหล่
งเก็
บข้
อมู
ลเกี่
ยวกั
บเนื้
อความกฎหมายของประมวลกฎหมาย
แพ่
งและพาณิ
ชย์
ซึ่
งในงานวิ
จั
ยนี้
ผู้
วิ
จั
ยได้
รวบรวมข้
อมู
ลเนื้
อความกฎหมายของช่
วงปี
พ.ศ. 2471 -2534 ตั้
งแต่
หมายเลข
มาตราที่
4-1,755 จานวน 1,755 มาตรา และช่
วงปี
พ.ศ. 2535-2559 ตั้
งแต่
หมายเลขมาตราที่
4-1,755 จานวน 1,864
1...,257,258,259,260,261,262,263,264,265,266 268,269,270,271,272,273,274,275,276,277,...300
Powered by FlippingBook