การประชุมวิชาการระดับชาติมหาวิทยาลัยทักษิณ 2559 - page 256

255
ประเภทข้
อมู
ลนี้
ได้
นาไปประยุ
กต์
ใช้
ในหลายด้
าน เช่
น การจั
ดกลุ่
มลู
กค้
าทางการตลาด การพยากรณ์
การเกิ
ดโรค และการ
วิ
เคราะห์
สภาพภู
มิ
อากาศ เป็
นต้
อั
ลกอริ
ทึ
มต้
นไม้
การตั
ดสิ
นใจ
วิ
ธี
การสร้
างต้
นไม้
ตั
ดสิ
นใจเชิ
งอุ
ปนั
ย มี
ขั้
นตอนโดยทั่
วไปดั
งนี้
[3] เลื
อกคุ
ณลั
กษณะสาคั
ญที่
ทาหน้
าที่
เป็
นโหนดราก
จากนั้
นสร้
างเส้
นทางเชื่
อมจากโหนดรากไปยั
งโหนดลู
ก โดยจานวนเส้
นทางเชื่
อมจะเท่
ากั
บจานวนค่
าที่
เป็
นไปได้
ทั้
งหมดของ
คุ
ณลั
กษณะที่
เป็
นโหนดราก ถ้
าโหนดลู
กเป็
นกลุ่
มของข้
อมู
ลที่
อยู่
ในคลาสเดี
ยวกั
นทั้
งหมด ให้
หยุ
ดการสร้
างต้
นไม้
แต่
ถ้
าโหนด
ลู
กมี
ข้
อมู
ลของหลายผลการทานาย ปะปนกั
นอยู่
ต้
องสร้
างต้
นไม้
ย่
อย เพื่
อจาแนกข้
อมู
ลต่
อไป โดยเลื
อกคุ
ณลั
กษณะมาทาหน้
าที่
เป็
นโหนดรากของต้
นไม้
ย่
อย และทาซ้
าในขั้
นตอนข้
างต้
โดยในงานวิ
จั
ยนี้
เลื
อกใช้
อั
ลกอริ
ทึ
ม ID3 ซึ่
งใช้
ค่
า Information Gain ในการประมวลผล และอั
ลกอริ
ทึ
ม C4.5 ซึ่
งใช้
ค่
า Gain Ratio ในการประมวลผล
โดย Information Gain มี
การคานวณที่
ไม่
ซั
บซ้
อนแต่
ยั
งมี
ความเอนเอี
ยงในการคานวณ โดยสมการการคานวณแสดงดั
งสมการ
ที่
(1) และ (2)
(1)
(2)
ค่
าอั
ตราส่
วนเกน (Gain Ratio) (Tan, 2006; Richard, 2003) มี
วิ
ธี
การคานวณเช่
นเดี
ยวกั
บค่
า Information Gain
แต่
จะมี
การแก้
ปั
ญหาในเรื่
องความเอนเอี
ยงในการคานวณ โดยการเพิ่
มการหาค่
าสารสนเทศการแบ่
งแยก (Split Information)
[4] ซึ่
งจะมี
การคานวณที่
ละเอี
ยดมากขึ้
น ดั
งสมการที่
(3) และ (4)
(3)
(4)
เมื่
อ S คื
อ คุ
ณลั
กษณะที่
ใช้
ในการตั
ดสิ
นใจ และ V คื
อ ลั
กษณะเงื่
อนไขหรื
อประเภทการทานาย
อั
ลกอริ
ทึ
ม K-Nearest Neighbor
เป็
นอั
ลกอริ
ทึ
มในการจาแนกประเภท โดยการตรวจสอบระยะห่
างกั
บข้
อมู
ลข้
างเคี
ยง โดยจะเลื
อกข้
อมู
ลข้
างเคี
ยงหรื
เพื่
อนบ้
าน จานวน K ค่
า ซึ่
งใช้
สมการการคานวณระยะห่
าง [5] ได้
แก่
สมการ Euclidean Distance ดั
งสมการที่
(5)
(5)
โดย
d
Euclidean
(x
i
, y
i
)
คื
อ ระยะห่
างระหว่
างตั
วอย่
าง
x
i
และตั
วอย่
าง
y
i
x
i,k
คื
อ คุ
ณสมบั
ติ
ตั
วที่
k ของตั
วอย่
าง
x
i
1...,246,247,248,249,250,251,252,253,254,255 257,258,259,260,261,262,263,264,265,266,...300
Powered by FlippingBook