สวัสดีและยินดีต้อนรับสู่ Machine Learning Made Easy ฉันชื่อชาแชงก์ ปราซานนา ฉันเป็นผู้จัดการผลิตภัณฑ์สถิติและผลิตภัณฑ์แมชชีนเลิร์นนิงที่ MathWorks
นี่คือวาระการประชุมสำหรับการนำเสนอที่เหลือของวันนี้ ฉันจะเริ่มต้นด้วยภาพรวมระดับสูงว่าแมชชีนเลิร์นนิงคืออะไรและเหตุใดคุณจึงควรพิจารณา จากนั้นเราจะเห็นความท้าทายที่สำคัญบางประการในการเรียนรู้ของเครื่อง
ต่อไป ฉันจะเจาะลึกลงไปในแมชชีนเลิร์นนิงโดยการแก้ปัญหาที่น่าสนใจที่เกี่ยวข้องกับข้อมูลในโลกแห่งความเป็นจริง เพื่อจัดการกับปัญหานี้ ฉันจะแนะนำเวิร์กโฟลว์ทั่วไปที่มักใช้ในการแก้ปัญหาแมชชีนเลิร์นนิง จากนั้นเราจะพูดถึงตัวอย่างที่น่าสนใจอีกตัวอย่างหนึ่งที่เกี่ยวข้องกับข้อมูลรูปภาพ ฉันจะแสดงให้คุณเห็นการสาธิตสดที่ใช้วิดีโอจากเว็บแคมเพื่อระบุวัตถุ เราจะสรุปเซสชันด้วยการสรุปและคำแนะนำบางประการว่าควรพิจารณาการเรียนรู้ของเครื่องเมื่อใด
เนื่องจากเป็นหัวข้อ Made Easy จึงไม่มีข้อกำหนดเบื้องต้น ความคุ้นเคยพื้นฐานกับ MATLAB นั้นมีประโยชน์ แต่ไม่จำเป็น แมชชีนเลิร์นนิงมีอยู่ทั่วไป เทคนิคเหล่านี้ถูกนำมาใช้มากขึ้นในโลกปัจจุบันเพื่อตัดสินใจทางธุรกิจและชีวิตที่สำคัญ ทุกวันนี้ การเรียนรู้ด้วยเครื่องช่วยให้เราสามารถแก้ปัญหาด้านยานยนต์ การเงิน คอมพิวเตอร์วิทัศน์ และสาขาอื่นๆ ที่ก่อนหน้านี้ถือว่าเป็นไปไม่ได้
แล้วแมชชีนเลิร์นนิงคืออะไร มาใช้เวลาสักครู่เพื่อทำความเข้าใจแนวคิดระดับสูงของแมชชีนเลิร์นนิงอย่างรวดเร็ว แม้ว่าคุณจะคุ้นเคยกับหัวข้อนี้แล้ว แต่สิ่งนี้ควรเป็นเครื่องเตือนใจอย่างรวดเร็วว่าเมื่อใดที่การติดตามแมชชีนเลิร์นนิงมีประโยชน์จริง ๆ
เราสามารถกำหนดให้แมชชีนเลิร์นนิงเป็นเทคนิคที่ใช้ข้อมูลและสร้างโปรแกรมเพื่อทำงาน ให้ฉันอธิบายในบริบทของตัวอย่าง พิจารณางานที่เกี่ยวข้องกับการใช้ข้อมูลเซ็นเซอร์จากโทรศัพท์มือถือเพื่อตรวจจับกิจกรรมของบุคคล เช่น ถ้าบุคคลนั้นกำลังเดิน นั่ง ยืน เป็นต้น แนวทางมาตรฐานในการแก้ปัญหาดังกล่าวคือการวิเคราะห์สัญญาณและเขียนโปรแกรมด้วยชุดกฎที่ออกแบบมาอย่างดี หรือคุณอาจทราบชุดของสมการหรือสูตรที่ใช้อินพุตและทำนายผลลัพธ์
แนวทางการเรียนรู้ของเครื่องคือการเรียนรู้โปรแกรมดังกล่าวโดยตรงจากข้อมูล ในกรณีนี้ เราจัดเตรียมอัลกอริทึมด้วยข้อมูลอินพุตและเอาต์พุตและให้อัลกอริทึมเรียนรู้โปรแกรมเพื่อแก้ปัญหานี้ ขั้นตอนนี้มักเรียกว่าการฝึกอบรม เอาต์พุตเป็นแบบจำลองที่สามารถใช้เพื่อตรวจจับกิจกรรมจากข้อมูลเซ็นเซอร์ใหม่
โปรดทราบว่าฉันไม่ได้กล่าวถึงอัลกอริทึมแมชชีนเลิร์นนิงที่เฉพาะเจาะจงอย่างชัดเจน เนื่องจากอัลกอริทึมมีให้เลือกมากมาย และแต่ละอันก็มีจุดแข็งและจุดอ่อนของตัวเอง เราจะเห็นว่าเมื่อเราดูตัวอย่างนี้โดยละเอียด หากมีสองสิ่งที่ฉันต้องการให้คุณนำออกจากสไลด์นี้ นั่นคือ หนึ่ง คุณต้องการข้อมูล หากไม่มีข้อมูล คุณจะทำแมชชีนเลิร์นนิงไม่ได้ นี่เป็นความต้องการที่แข็งแกร่ง
สอง พิจารณาการเรียนรู้ของเครื่องเฉพาะเมื่องานนั้นซับซ้อน และไม่มีสมการวิเศษหรือสูตรในการแก้ หากคุณมีสูตร คุณสามารถดำเนินการต่อได้เลย แมชชีนเลิร์นนิงจะใช้งานได้ แต่ไม่แนะนำวิธีการในสถานการณ์เช่นนี้
ไปที่ MATLAB และดูว่าวิธีการเรียนรู้ของเครื่องเป็นอย่างไร ข้อมูลที่เรากำลังทำงานประกอบด้วยอินพุตหกตัว สามตัวจากมาตรความเร่ง และสามตัวจากไจโรสโคปของโทรศัพท์มือถือ การตอบสนองหรือผลลัพธ์คือกิจกรรมที่ดำเนินการ ได้แก่ การเดิน การยืน การวิ่ง การปีนบันได และการวาง
นี่คือ Classification Learner เป็นเครื่องมือเชิงโต้ตอบที่ให้คุณทำงานการเรียนรู้ของเครื่องทั่วไป เช่น การสำรวจข้อมูลของคุณแบบโต้ตอบ เลือกคุณสมบัติ ระบุรูปแบบการตรวจสอบความถูกต้อง แบบจำลองการฝึกอบรม และการประเมินผลลัพธ์ ทางด้านซ้ายของฉัน ฉันมีโมเดลแมชชีนเลิร์นนิงหลายแบบที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลเซ็นเซอร์แล้ว ถัดจากแต่ละรุ่นคือตัวเลขเปอร์เซ็นต์ที่ระบุความถูกต้องของตัวแยกประเภทที่เลือกในชุดการตรวจสอบที่แยกจากกัน ฉันสามารถใช้การแสดงภาพทางด้านขวาเพื่อสำรวจข้อมูลของฉันเพื่อค้นหารูปแบบและแนวโน้ม
การฝึกอบรมโมเดลใหม่เป็นเรื่องง่าย ฉันแค่ไปที่แกลเลอรีตัวแยกประเภท เลือกตัวแยกประเภทที่สนใจ แล้วกด Train เมื่อการฝึกอบรมเสร็จสิ้น คุณสามารถดูโมเดลใหม่ในรายการประวัติพร้อมกับความแม่นยำในการปฏิบัติงานของโมเดล ยิ่งตัวเลขนี้สูง แบบจำลองอาจทำงานได้ดีกับข้อมูลใหม่ ฉันจะเลือกโมเดลที่มีประสิทธิภาพดีที่สุดของฉัน แล้วคลิก ส่งออก เพื่อเริ่มใช้โมเดลของฉันใน MATLAB และฉันเห็นว่าโมเดลที่ส่งออกอยู่ที่นี่ในพื้นที่ทำงาน
ตอนนี้ฉันต้องการใช้โมเดลนี้พร้อมกับข้อมูลทดสอบบางส่วน เพื่อแสดงภาพผลการทำนายของโมเดล นี่คือพล็อตที่แสดงการสตรีมข้อมูลมาตรวัดความเร่งและไจโรสโคปเป็นเวลาสองวินาทีครึ่ง แถบสีเขียวด้านบนนี้แสดงกิจกรรมจริงที่บุคคลนั้นทำซึ่งสอดคล้องกับสัญญาณเซ็นเซอร์ตรงนี้ แถบด้านล่างจะเป็นสีเขียวหากแบบจำลองสามารถทำนายกิจกรรมจริงของบุคคลได้สำเร็จ และจะเป็นสีแดงหากเป็นเช่นนั้น—หากไม่สามารถคาดการณ์กิจกรรมจริงได้ คุณจะเห็นว่านางแบบมักจะสับสนระหว่างการเดินและการปีนบันได
มาสรุปสิ่งที่เราเพิ่งประสบความสำเร็จกันอย่างรวดเร็ว เราใช้ข้อมูลเพื่อให้เหมาะกับโมเดลต่างๆ โดยใช้ Classification Learner จากนั้นเราเลือกอันที่ให้ผลลัพธ์ดี และเราทดสอบเพื่อให้แน่ใจว่ามันเป็นไปตามที่ควรจะเป็น ดูเหมือนจะค่อนข้างง่าย แล้วทำไมแมชชีนเลิร์นนิงถึงมีชื่อเสียงว่ายากนัก
เพื่อตอบคำถามนั้น ฉันต้องการใช้คำพูดของนักสถิติที่มีชื่อเสียงซึ่งเคยเขียนไว้ในตำราเรียนว่า "แบบจำลองทั้งหมดผิด แต่บางแบบจำลองก็มีประโยชน์" ทำไม เนื่องจากแบบจำลองเป็นการประมาณ ไม่ใช่แค่โมเดลแมชชีนเลิร์นนิงเท่านั้น โมเดลทั้งหมดเป็นการประมาณตามสมมติฐานต่างๆ แต่ก็ไม่ได้ทำให้มีประโยชน์น้อยลง โมเดลแมชชีนเลิร์นนิงสามารถอธิบายรูปแบบที่ซับซ้อนในข้อมูลได้ แต่หากต้องการใช้แมชชีนเลิร์นนิงให้ประสบความสำเร็จ คุณต้องค้นหาโมเดลที่มีประโยชน์ และนั่นอาจเป็นงานที่ท้าทาย
ในความเป็นจริงไม่มีความท้าทายเพียงอย่างเดียว แต่มีความท้าทายหลายอย่างในทุกขั้นตอนของเวิร์กโฟลว์แมชชีนเลิร์นนิง ข้อมูลมาในรูปทรงและขนาดต่างๆ อาจเป็นข้อมูลตัวเลขธรรมดา เช่น จากฟีดข้อมูลทางการเงินหรือสัญญาณเซ็นเซอร์ หรืออาจเป็นการสตรีมรูปภาพจากกล้องหรือข้อมูลข้อความ ชุดข้อมูลในโลกแห่งความเป็นจริงมักจะยุ่งเหยิงและไม่เป็นตารางเสมอไป
ข้อมูลก่อนการประมวลผลต้องใช้อัลกอริทึมและเครื่องมือเฉพาะโดเมน ตัวอย่างเช่น จำเป็นต้องใช้อัลกอริธึมการประมวลผลสัญญาณหรือภาพเพื่อแยกคุณสมบัติที่เป็นประโยชน์จากข้อมูลสัญญาณและภาพ อัลกอริทึมสถิติจำเป็นสำหรับการเลือกคุณสมบัติและการแปลงคุณสมบัติ เรามักต้องการเครื่องมือจากหลายโดเมน และเมื่อทำงานกับอัลกอริทึมการเรียนรู้ของเครื่องหลายตัว การค้นหาโมเดลที่ดีที่สุดอาจเป็นงานที่น่ากลัวและใช้เวลานาน
หัวใจสำคัญของการเลือกโมเดลแมชชีนเลิร์นนิงที่ดีที่สุดคือการปรับสมดุล แบบจำลองที่มีความยืดหยุ่นสูงอาจแม่นยำ แต่อาจเกินข้อมูลของคุณและทำงานได้ไม่ดีกับข้อมูลใหม่ ในอีกรูปแบบหนึ่ง แบบจำลองที่เรียบง่ายอาจสันนิษฐานเกี่ยวกับข้อมูลมากเกินไป มีการแลกเปลี่ยนเสมอระหว่างความเร็ว ความแม่นยำ และความซับซ้อนของแบบจำลอง
ประการสุดท้าย เวิร์กโฟลว์แมชชีนเลิร์นนิงไม่เคยเป็นเวิร์กโฟลว์เชิงเส้นที่สะดวก เราต้องกลับไปกลับมา ทำซ้ำ และลองแนวคิดต่างๆ อยู่เสมอ ก่อนที่เราจะมาบรรจบกันในการแก้ปัญหา เป้าหมายของฉันในวันนี้: แนะนำให้คุณรู้จักกับชุดเครื่องมือและกลยุทธ์ทั่วไปเพื่อรับมือกับความท้าทายเหล่านี้
ต่อไปนี้คือเวิร์กโฟลว์สองขั้นตอนง่ายๆ ที่เราอยากทำตามในการแก้ปัญหาแมชชีนเลิร์นนิง ขั้นตอนแรกคือการฝึกโมเดลของคุณ เราเริ่มต้นด้วยการนำข้อมูลเข้ามา ซึ่งจะมาจากแหล่งต่างๆ ที่หลากหลาย เช่น ฐานข้อมูล อุปกรณ์สตรีมมิ่ง เป็นต้น ต่อไป เราจะประมวลผลข้อมูลล่วงหน้าโดยใช้การแยกคุณลักษณะหรือเครื่องมือทางสถิติอื่นๆ ขั้นตอนนี้มีความสำคัญอย่างยิ่งต่อการแปลงข้อมูลของคุณให้เป็นรูปแบบที่อัลกอริทึมการเรียนรู้ของเครื่องสามารถทำงานได้
หลังจากนั้นเราก็พร้อมที่จะเรียนรู้จากข้อมูล หากงานคือการคาดคะเนป้ายกำกับหรือหมวดหมู่ เราเลือกวิธีการจำแนกประเภท หากงานคือการทำนายค่าต่อเนื่อง เราจะเลือกวิธีการถดถอย จากนั้นเราจะดำเนินการต่อและสร้างแบบจำลอง แน่นอนว่านี่เป็นกระบวนการที่เกิดซ้ำๆ กันซึ่งต้องย้อนกลับไปมาจนถึงขั้นตอนก่อนการประมวลผล ลองใช้อัลกอริทึมการเรียนรู้ของเครื่องต่างๆ ปรับแต่งพารามิเตอร์ต่างๆ และอื่นๆ
ขั้นตอนที่สองของเวิร์กโฟลว์นี้คือการใช้โมเดลจริง ดังนั้นทางด้านซ้าย ฉันมีข้อมูลใหม่ และทางขวา ฉันต้องทำการคาดการณ์ แล้วเราต้องการอะไรจากข้อมูลไปสู่การคาดการณ์? ขั้นแรก เราต้องใช้ขั้นตอนก่อนการประมวลผลทั้งหมดสำหรับข้อมูลใหม่ ดังนั้นจึงไม่มีงานเพิ่มเติมที่เกี่ยวข้องในส่วนนี้ เราแค่นำความทุ่มเททั้งหมดที่เราใช้ไปในช่วงการฝึกกลับมาใช้ใหม่
ต่อไป เราใช้แบบจำลองจากขั้นตอนการฝึกอบรมและทำการคาดคะเน สำหรับปัญหาทางวิศวกรรมหลายประการ ขั้นตอนที่สองมักถูกปรับใช้หรือรวมเข้ากับสภาพแวดล้อมการผลิต เช่น บนเซิร์ฟเวอร์ที่ดำเนินการลักษณะอัตโนมัติโดยใช้การเรียนรู้ของเครื่อง ลองใช้เวิร์กโฟลว์นี้เพื่อดูตัวอย่างใน MATLAB
เป้าหมายของตัวอย่างนี้คือการฝึกตัวแยกประเภทให้ระบุกิจกรรมของมนุษย์โดยอัตโนมัติตามการวัดเซ็นเซอร์ ข้อมูลประกอบด้วยหกอินพุต สามตัวจากมาตรความเร่ง และสามตัวจากไจโรสโคป การตอบสนองของผลลัพธ์คือกิจกรรมที่ทำ: เดิน ยืน วิ่ง ปีนบันได และวาง
แนวทางที่เราจะใช้มีดังนี้ ขั้นแรก เราจะดึงคุณสมบัติพื้นฐานจากสัญญาณเซ็นเซอร์ จากนั้น เราจะใช้ Classification Learner เพื่อฝึกและเปรียบเทียบ Classifiers ต่างๆ และสุดท้ายคือทดสอบผลลัพธ์จากข้อมูลเซ็นเซอร์ที่มองไม่เห็น
นี่คือ MATLAB เราจะเริ่มต้นด้วยหน้าต่างโฟลเดอร์ปัจจุบันที่นี่ เนื่องจากขั้นตอนแรกของเวิร์กโฟลว์คือการนำข้อมูลเข้ามา ฉันจะโหลดข้อมูลเซ็นเซอร์ดิบบางส่วนที่มีในไฟล์ MAT ในการนำเข้าข้อมูลนี้ สิ่งที่ฉันต้องทำก็แค่ลากและวางลงในหน้าต่างเวิร์กสเปซ หน้าต่างพื้นที่ทำงานช่วยให้คุณติดตามตัวแปรทั้งหมดใน MATLAB ไม่ว่าจะเป็นตัวแปรที่มีอยู่หรือตัวแปรใหม่ที่เราสร้างขึ้นเมื่อเราดำเนินการ
ข้อมูลของฉันประกอบด้วยเจ็ดตัวแปร หกตัวแรกคือตัวแปรอินพุตทางประสาทสัมผัส สามตัวสำหรับไจโรสโคป และสามตัวสำหรับมาตรความเร่ง x, y และ z ตัวแปรสุดท้าย TrainActivity มีป้ายกำกับกิจกรรมสำหรับการสังเกตการวัดเซ็นเซอร์แต่ละครั้ง สังเกตว่าตัวแปรทั้งหมดมีการสังเกตประมาณ 7,000 รายการ มาดูกันว่าการป้อนข้อมูลทางประสาทสัมผัสของแต่ละคนมีลักษณะอย่างไร
ถ้าผมพล็อตข้อมูลไจโรสโคปแกน x แถวเดียว เราจะเห็นว่ามีจุดประมาณ 128 จุด นี่คือสิ่งที่ข้อมูลแสดง ข้อมูลเซ็นเซอร์มักถูกรวบรวมและแก้ไขด้วยกรอบหน้าต่าง แต่ละแถวมี 128 ค่าที่อ่านได้ สอดคล้องกับข้อมูลเซ็นเซอร์ 2 วินาทีครึ่ง
ขณะนี้ ข้อมูลนี้ไม่อยู่ในรูปแบบที่สามารถใช้สำหรับการเรียนรู้ของเครื่อง ก่อนอื่น ฉันต้องประมวลผลอินพุตทั้งหมดเหล่านี้เพื่อแยกคุณสมบัติสำหรับแต่ละจุดจาก 128 จุดหรือหน้าต่าง 2 วินาทีครึ่ง และฉันต้องดำเนินการนี้กับอินพุตเซ็นเซอร์ทั้ง 6 ตัว แต่ก่อนที่เราจะเริ่มต้นด้วยการสกัดคุณลักษณะ ลองมาดูกันว่าข้อมูลดิบของเซ็นเซอร์มีลักษณะอย่างไร
ฉันมีพล็อตที่กำหนดเองที่นี่ซึ่งแสดงข้อมูลเซ็นเซอร์ดิบของมาตรวัดความเร่งสามรายการ และพวกมันมีสีต่างกันซึ่งสอดคล้องกับกิจกรรมที่บุคคลกำลังทำอยู่ พล็อตใน MATLAB ค่อนข้างโต้ตอบได้ ฉันสามารถขยายเพื่อดูว่ามีรูปแบบภาพใด ๆ หรือมีแนวโน้มที่สามารถช่วยให้เราระบุกิจกรรมของบุคคลนั้นได้หรือไม่
เราจะเห็นว่าค่าเซ็นเซอร์ดูแตกต่างกันสำหรับแต่ละสีเหล่านี้ ตัวอย่างเช่น ค่าสีส้มที่นี่ซึ่งสอดคล้องกับการปีนบันไดจะค่อนข้างแตกต่างจากค่าสีม่วงซึ่งสอดคล้องกับการยืน อย่างไรก็ตาม ในขณะเดียวกันก็ยากที่จะแยกความแตกต่างระหว่างการเดินและการปีนเขาด้วยสายตา เนื่องจากทั้งสองอย่างเกี่ยวข้องกับการเคลื่อนไหวอย่างมาก ปัญหาเช่นนี้เป็นตัวเลือกที่ดีสำหรับแมชชีนเลิร์นนิง เนื่องจากไม่ชัดเจนเสมอไปว่าเราสามารถกำหนดกฎสำหรับแต่ละกิจกรรมเหล่านี้ได้
ก่อนที่เราจะเริ่มด้วยขั้นตอนการแยกคุณลักษณะ ฉันจะสร้างตารางเดียวจากอินพุตเซ็นเซอร์ทั้งหกนี้ ตารางเป็นเครื่องมือที่ยอดเยี่ยมสำหรับการเก็บข้อมูลแบบผสม ซึ่งเป็นเรื่องปกติในการเรียนรู้ของเครื่อง ในตัวอย่างนี้ เรามีหน่วยวัดเซนเซอร์ซึ่งเป็นตัวเลข และป้ายกำกับซึ่งเป็นค่าตามหมวดหมู่
ตอนนี้ฉันมีตัวแปรตารางเดียวในพื้นที่ทำงานของฉันที่มีตัวแปรเซ็นเซอร์แต่ละตัวทั้งหมดหกตัว ข้อดีอีกประการของการใช้ตารางสำหรับแมชชีนเลิร์นนิงคือฉันสามารถใช้ฟังก์ชันการแยกคุณลักษณะเดียวกับตัวแปรทั้งหมดในตารางนี้ด้วยโค้ดบรรทัดเดียว สิ่งที่ฉันต้องทำคือเรียก VarFun ซึ่งย่อมาจาก Variable Function และส่งฟังก์ชันการแยกคุณลักษณะของฉัน WMean นี่คือฟังก์ชันที่คำนวณค่าเฉลี่ยของแต่ละแถวในตัวแปรเซนเซอร์ ในกรณีนี้ ฉันกำลังคำนวณค่าเฉลี่ยของค่าเซ็นเซอร์ 2 วินาทีครึ่ง
WMean เป็นฟังก์ชันในเบราว์เซอร์โฟลเดอร์ปัจจุบันของฉัน และอย่างที่คุณเห็น มันเป็นฟังก์ชันที่ค่อนข้างง่าย แต่ทั้งนี้ขึ้นอยู่กับแอปพลิเคชันของคุณและคุณลักษณะที่คุณต้องการแยกออกมา ซึ่งอาจซับซ้อนเท่าที่คุณต้องการ นอกจากค่าเฉลี่ยแล้ว ฉันต้องการแยกคุณลักษณะอีกสองอย่าง ซึ่งเป็นส่วนเบี่ยงเบนมาตรฐานสำหรับแต่ละเฟรม และ PCA ซึ่งย่อมาจากการวิเคราะห์องค์ประกอบหลัก และฉันต้องการคงไว้เฉพาะองค์ประกอบหลักแรกเท่านั้น เนื่องจากตารางสามารถเก็บข้อมูลประเภทผสมได้ ฉันจะกำหนดป้ายกำกับกิจกรรมเป็นตัวแปรใหม่ที่เรียกว่ากิจกรรมภายในตาราง
ลองเรียกใช้ส่วนนี้และดูว่าตารางข้อมูลกิจกรรมของมนุษย์มีลักษณะอย่างไร ฉันมีทั้งหมด 19 คอลัมน์ และหกคอลัมน์แรกตรงกับค่าเฉลี่ยของเฟรม หกรายการถัดไปคือส่วนเบี่ยงเบนมาตรฐานของเฟรม และหกรายการสุดท้ายคือเอาต์พุต PCA คอลัมน์สุดท้ายของฉันคือกิจกรรมที่สอดคล้องกับการสังเกตแต่ละครั้ง ซึ่งอาจจะเป็นการนอน การนั่ง การขึ้นบันได การยืน หรือการเดิน
ตอนนี้เรามีข้อมูลพร้อมแล้ว เรามาย้าย Classification Learner เพื่อฝึกโมเดลของเรากัน Classification Learner เป็นส่วนหนึ่งของกล่องเครื่องมือสถิติและการเรียนรู้ของเครื่อง และคุณสามารถเปิดใช้งานได้โดยพิมพ์ Classification Learner ในบรรทัดคำสั่ง MATLAB หรือคุณสามารถหาได้จาก AppStat ภายใต้ MAT Statistics and Optimization
ก่อนอื่นเราเริ่มต้นด้วยการนำเข้าข้อมูลจากพื้นที่ทำงานของ MATLAB ภายใต้ขั้นตอนที่หนึ่งของกล่องโต้ตอบการนำเข้า เราเลือกชุดข้อมูลจากพื้นที่ทำงานของ MATLAB ภายใต้ขั้นตอนที่สอง ให้สังเกตว่าแอพจะเลือกโดยอัตโนมัติว่าตัวแปรเป็นตัวทำนายหรือการตอบสนอง
แอปจะตัดสินใจตามประเภทข้อมูล อย่างไรก็ตาม คุณยังสามารถเลือกที่จะเปลี่ยนบทบาทหรือลบตัวแปรทั้งหมดได้ สำหรับตอนนี้ เราปล่อยไว้ตามที่เป็นอยู่
ภายใต้ขั้นตอนที่สาม เราสามารถเลือกวิธีการตรวจสอบของเราได้ การตรวจสอบจะช่วยป้องกันปัญหาต่างๆ เช่น การใส่มากเกินไป เลือกการตรวจสอบข้ามเมื่อคุณมีชุดข้อมูลที่มีขนาดค่อนข้างเล็ก เนื่องจากจะทำให้ใช้ข้อมูลทั้งหมดได้อย่างมีประสิทธิภาพ เลือก ระงับ หากคุณมีข้อมูลเพียงพอ
ฉันจะเลือกตัวเลือกนี้สำหรับปัญหาของเรา เนื่องจากเรามีจุดข้อมูลจำนวนมาก การตั้งค่าเปอร์เซ็นต์ Hold Out ของฉันเป็น 20% จะสั่งให้แอปใช้ข้อมูล 80% สำหรับการฝึกอบรมและ 20% สำหรับการตรวจสอบประสิทธิภาพของโมเดล ตัวเลือกสุดท้ายมักไม่แนะนำ เนื่องจากข้อมูลทั้งหมดใช้สำหรับการฝึกอบรมและการทดสอบ สิ่งนี้นำไปสู่การประมาณค่าความแม่นยำของแบบจำลองที่มีอคติ
Classification Learner เป็นสภาพแวดล้อมที่ค่อนข้างมีการโต้ตอบซึ่งมีหน้าต่างและส่วนประกอบต่างๆ มากมาย และฉันสัญญาว่าเราจะพิจารณาทุกหน้าต่างและเมื่อมีความเกี่ยวข้องกัน แถบเครื่องมือด้านบนแสดงเวิร์กโฟลว์จากซ้ายไปขวาตั้งแต่การนำเข้าข้อมูลไปจนถึงการส่งออกโมเดลของคุณ ที่ตรงกลางนี่คือพล็อตกระจายแบบจับคู่ที่จัดกลุ่มตามตัวแปรตอบสนอง
พล็อตนี้มีประโยชน์สำหรับการค้นหารูปแบบ ตัวอย่างเช่น ตัวทำนายคู่นี้ เราสังเกตเห็นว่าการวางดูเหมือนจะแยกออกจากกิจกรรมที่เหลือเป็นอย่างดี การนั่งก็ดูเหมือนจะแยกจากกันดี แต่ก็มีบางส่วนที่เหลื่อมกัน ตัวเลือกการเลือกคุณลักษณะบนแถบเครื่องมือช่วยให้คุณแยกตัวทำนายออกจากแบบจำลองได้ สำหรับตัวอย่างนี้ เนื่องจากเราไม่มีตัวทำนายมากเกินไป เราจะปล่อยไว้อย่างนั้น
เมื่อแก้ปัญหาการจำแนกประเภท ไม่มีขนาดเดียวที่เหมาะกับทุกคน ตัวแยกประเภทที่แตกต่างกันทำงานได้ดีที่สุดสำหรับข้อมูลและปัญหาประเภทต่างๆ Classification Learner ให้คุณเลือกจากแผนผังการตัดสินใจ เครื่องสนับสนุนเวกเตอร์ เพื่อนบ้านที่ใกล้ที่สุด และตัวแยกประเภททั้งมวล และสำหรับตัวแยกประเภทแต่ละประเภท จะมีค่าที่ตั้งไว้ล่วงหน้าหลายค่าที่เป็นจุดเริ่มต้นที่ดีสำหรับปัญหาการจำแนกประเภทต่างๆ หากคุณไม่แน่ใจว่าจะเลือกตัวใด คำแนะนำเกี่ยวกับเครื่องมือแบบป๊อปอัปจะให้คำอธิบายสั้นๆ ของตัวแยกประเภทแก่คุณ
เมื่อทำงานกับ MATLAB ความช่วยเหลือจะอยู่ใกล้แค่คลิกเดียว หากต้องการความช่วยเหลือเพิ่มเติม เพียงคลิกที่เครื่องหมายคำถามที่ด้านบนขวา ซึ่งจะเป็นการเปิดเอกสารประกอบสำหรับแอป คุณจะพบข้อมูลทั้งหมดที่คุณต้องการเกี่ยวกับแอปได้ที่นี่ สำหรับตอนนี้ ไปที่ส่วนต่อไปนี้ซึ่งมีคำแนะนำในการเลือกลักษณนาม
ต่อไปนี้เป็นตารางที่ดีที่จะให้คำแนะนำเกี่ยวกับตัวแยกประเภทที่จะเลือก โดยขึ้นอยู่กับการแลกเปลี่ยนที่คุณต้องการ ตัวอย่างเช่น แผนภูมิการตัดสินใจมีความพอดีอย่างรวดเร็ว แต่มีความแม่นยำในการทำนายปานกลาง ในทางกลับกัน เพื่อนบ้านที่ใกล้ที่สุดมีความแม่นยำในการคาดคะเนสูงสำหรับปัญหาเล็กๆ น้อยๆ แต่ก็มีการใช้หน่วยความจำสูงเช่นกัน ลองใช้เคล็ดลับนี้จากเอกสารและเริ่มด้วยแผนผังการตัดสินใจก่อน
การฝึกอบรมแบบจำลองเป็นเรื่องง่าย เพียงเลือกค่าที่ตั้งไว้ล่วงหน้าจากแกลเลอรีและ Hit Train จากนั้นระบบจะสร้างโมเดลรถไฟในประวัติโมเดล พร้อมด้วยความแม่นยำในการทำนาย มาฝึกต้นไม้ขนาดกลางและต้นไม้ที่ซับซ้อนกันเถอะ โมเดลที่ทำงานได้ดีที่สุดในชุดการตรวจสอบจะแสดงด้วยกล่องสีเขียวเสมอ
นอกจากเปอร์เซ็นต์ความแม่นยำในการทำนายแล้ว ยังมีเครื่องมือวินิจฉัยอื่นๆ ที่เป็นประโยชน์อีกด้วย เมทริกซ์ความสับสนเป็นเครื่องมือที่ยอดเยี่ยมที่สามารถบอกคุณได้ว่าตัวแยกประเภททำงานอย่างไรได้อย่างรวดเร็ว ดังนั้นนี่คือวิธีที่คุณอ่านเมทริกซ์ความสับสน สิ่งใดในแนวทแยงได้รับการจัดประเภทอย่างถูกต้อง สิ่งที่อยู่นอกเส้นทแยงมุมได้รับการจัดประเภทผิด ตัวแยกประเภทที่สมบูรณ์แบบจะมี 100% ในแนวทแยงและ 0% ในที่อื่น
มาดูกิจกรรมหนึ่งกันดีกว่า: การปีนบันได วิธีการอ่านสิ่งนี้คือ 89.1% ของเวลาที่แบบจำลองทำนายกิจกรรมได้สำเร็จ อย่างไรก็ตาม 10.9% ของเวลาทั้งหมด นางแบบคิดว่าการปีนบันไดคือการเดิน หรืออีกนัยหนึ่ง นางแบบจำแนกการปีนบันไดผิดว่าเป็นการเดิน เราสามารถสลับไปมาระหว่างรุ่นต่างๆ ในประวัติศาสตร์ยุคใหม่เพื่อเปรียบเทียบเมทริกซ์ความสับสนได้เสมอ
เครื่องมือวินิจฉัยอื่นที่มีอยู่ในแอปคือ Auto C Curve เส้นโค้ง Auto C ใช้เพื่ออธิบายความไวของตัวแยกประเภทไบนารี รูปร่างของเส้นโค้งแสดงการแลกเปลี่ยนระหว่างความไวและความจำเพาะ เมื่อเราเลื่อนขึ้นไปทางขวาของเส้นโค้ง เราเพิ่มโอกาสของผลบวกจริง แต่ยังเพิ่มโอกาสของผลบวกลวงด้วย
ในความคิดของฉัน ข้อดีอย่างหนึ่งของการใช้แอปแทนการเขียนโค้ดคือความสามารถในการฝึกโมเดลหลายๆ แบบ นอกจากแผนผังการตัดสินใจแล้ว ตอนนี้ฉันจะฝึกตัวแยกประเภทเพื่อนบ้านที่ใกล้ที่สุด เพราะฉันรู้ว่าพวกมันฝึกได้เร็วและทำนายได้เร็ว เมื่อฝึกโมเดลหลายตัว คุณไม่จำเป็นต้องจำกัดเฉพาะค่าที่ตั้งไว้ล่วงหน้าเหล่านี้
หากคุณเป็นผู้ใช้ขั้นสูง คุณสามารถเปิดป๊อปอัปขั้นสูงขึ้นมาเพื่อปรับแต่งพารามิเตอร์ตัวแยกประเภทได้เสมอ การเปลี่ยนแปลงเหล่านี้จะแสดงในประวัติรุ่นด้วยเพื่อความสะดวก ตอนนี้เรามีโมเดลประมาณแปดโมเดลในประวัติโมเดล และผมฝึกโมเดลทั้งหมดในเวลาไม่กี่วินาทีโดยไม่ต้องเขียนโค้ด MATLAB แม้แต่บรรทัดเดียว
มีสองโหมดที่คุณสามารถส่งออกการวิเคราะห์ของคุณได้ คุณสามารถส่งออกโมเดลของคุณไปยัง MATLAB ได้โดยตรง หรือจะเลือกสร้างโค้ด MATLAB ที่ให้คุณทำให้ขั้นตอนทั้งหมดที่เราดำเนินการในการสร้างโมเดลนี้เป็นไปโดยอัตโนมัติโดยไม่ต้องเขียนโค้ดใดๆ ให้ฉันเลือกตัวเลือกนี้เพื่อแสดงให้คุณเห็นว่าโค้ดที่สร้างขึ้นมีลักษณะอย่างไร
สิ่งที่ฉันมีใน MATLAB คือโค้ด MATLAB ที่สร้างโดยอัตโนมัติอย่างสมบูรณ์ เรายังสามารถดูขั้นตอนต่างๆ ในเวิร์กโฟลว์ที่โค้ดบันทึกไว้ได้อีกด้วย ตัวอย่างเช่น การแยกตัวทำนายและการตอบสนอง การฝึกตัวแยกประเภทโดยใช้ตัวแยกประเภท KNN และการตั้งค่าการตรวจสอบความถูกต้องของ Hold Out เป็นต้น คุณสามารถปรับแต่งรหัสที่สร้างขึ้นนี้เพื่อรวมเข้ากับแอปพลิเคชันของคุณได้ตลอดเวลา
กลับไปที่ Classification Learner และส่งออกแบบจำลองแทน และเราจะเห็นว่าขณะนี้แบบจำลองพร้อมใช้งานในพื้นที่ทำงาน MATLAB ตอนนี้เราพร้อมที่จะทดสอบโมเดลกับข้อมูลใหม่แล้ว ก่อนอื่น เราโหลดข้อมูลเซ็นเซอร์ใหม่จากไฟล์ MAT จากนั้นเราจะใช้ขั้นตอนการดึงคุณสมบัติเดิมจากก่อนหน้านี้ จากนั้นเราจะใช้โมเดลที่ส่งออกเพื่อทดสอบผลลัพธ์ของข้อมูลเซ็นเซอร์ใหม่นี้
ดังที่เราเห็นก่อนหน้านี้ แถบสีเขียวด้านบนแสดงกิจกรรมจริงที่บุคคลนั้นทำ และแถบสีเขียวด้านล่าง เมื่อแบบจำลองตรวจจับกิจกรรมได้สำเร็จ และจะเป็นสีแดงหากทำผิด หากคุณต้องการลองใช้โมเดลใหม่ คุณสามารถกลับไปที่ Classification Learner และส่งออกโมเดลโดยตรงหรือสร้างโค้ด MATLAB และฝึกโมเดลใหม่เพื่อคาดการณ์ด้วยข้อมูลใหม่
มาดูขั้นตอนการทำงานของเราอย่างรวดเร็วเพื่อสรุปสิ่งที่เราเพิ่งทำไป ข้อมูลการฝึกอบรมของเราคือสัญญาณเซ็นเซอร์ที่ได้จากเซ็นเซอร์โทรศัพท์มือถือ เราใช้เทคนิคการประมวลผลเบื้องต้นขั้นพื้นฐานเพื่อดึงคุณสมบัติต่างๆ เช่น ค่าเบี่ยงเบนมาตรฐานเฉลี่ยและ PCA จากนั้นเราก็ใช้แอป Classification Learner เพื่อให้ได้โมเดลที่ดีที่สุดโดยอิงตามความถูกต้องของการตรวจสอบ Holdout
สำหรับการคาดคะเนด้วยข้อมูลใหม่ เราใช้ขั้นตอนก่อนการประมวลผลเดียวกันกับข้อมูลใหม่ จากนั้นเราใช้แบบจำลองที่ได้รับการฝึกฝนเพื่อทำการคาดคะเนแล้วแสดงภาพผลลัพธ์ มาดูอีกตัวอย่างหนึ่งกัน ซึ่งเราจะฝึกโมเดลแมชชีนเลิร์นนิงโดยใช้ข้อมูลรูปภาพ วัตถุประสงค์ของตัวอย่างนี้คือการฝึกตัวแยกประเภทให้ตรวจจับรถยนต์โดยอัตโนมัติจากวิดีโอเว็บแคม ข้อมูลประกอบด้วยรูปภาพหลายรูปของรถของเล่นสี่คันที่แตกต่างกัน การตอบสนองของเอาต์พุตเป็นป้ายกำกับสำหรับรถทั้งสี่คันนี้
แนวทางที่เราจะใช้มีดังนี้ ขั้นแรก เราจะแยกคุณลักษณะออกจากภาพเหล่านี้โดยใช้เทคนิคที่เรียกว่าถุงคำ จากนั้นเราจะใช้คุณสมบัติเหล่านี้ในการฝึกอบรมและจัดประเภทตัวแยกประเภทต่างๆ โดยใช้ Classification Learner และสุดท้าย—นี่คือส่วนที่น่าสนใจ—เราจะได้เห็นการสาธิตสดของรถรุ่นที่เราฝึกฝนเพื่อระบุรถยนต์แบบเรียลไทม์จากฟีดเว็บแคมในสำนักงานของฉัน
ดังนั้นเรามาเปลี่ยนมาใช้ MATLAB กันเถอะ ฉันจะล้างพื้นที่ทำงานของฉันและเริ่มต้นกระดานชนวนใหม่ทั้งหมด ลองมาดูข้อมูลของเรากัน ต่อไปนี้คือกลุ่มรูปภาพและโฟลเดอร์ และชื่อโฟลเดอร์แต่ละชื่อจะเป็นป้ายกำกับสำหรับชุดรูปภาพในโฟลเดอร์นั้น มาดูกันว่าภาพนอก MATLAB มีลักษณะอย่างไร
ต่อไปนี้คือรูปภาพจำนวนมากสำหรับเนินทรายที่ถ่ายจากหลายมุมและสภาพแสงที่แตกต่างกัน และฉันมีรูปภาพดังกล่าวหลายรูปสำหรับรถทั้งสี่คัน เมื่อทำงานกับรูปภาพ การโหลดรูปภาพทั้งหมดเป็นลูปและการติดตามไฟล์และโฟลเดอร์ทั้งหมดและป้ายกำกับอาจเป็นเรื่องที่เจ็บปวด Computer Vision System Toolbox มีเครื่องมือที่สะดวก เช่น Image Set ที่ทำให้งานนี้ง่ายขึ้น ฉันเพียงแค่ให้ Image Set กับโฟลเดอร์ที่มีรูปภาพทั้งหมดของฉันและสั่งให้ดูที่โฟลเดอร์ย่อยทั้งหมดด้วย ข้อดีที่สำคัญอีกประการของ Image Set คือมันไม่ได้โหลดรูปภาพทั้งหมดไปยังหน่วยความจำ ดังนั้นจึงใช้งานได้ง่ายเมื่อคุณมีรูปภาพจำนวนมาก
ในการประมวลผลข้อมูลของฉันล่วงหน้าและเพื่อแยกคุณลักษณะต่างๆ ฉันจะใช้วิธีที่เรียกว่าถุงคุณลักษณะ นี่เป็นเทคนิคที่ค่อนข้างซับซ้อนในการแยกฟีเจอร์ออกจากรูปภาพและใช้งานได้ดีเป็นพิเศษ หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับฟังก์ชันนี้ เอกสารคู่มือ Computer Vision System Toolbox จะมีคำอธิบายโดยละเอียดเกี่ยวกับสิ่งที่อัลกอริทึมทำภายใต้ประทุน สำหรับตอนนี้ เราจะถือว่าฟังก์ชันนี้เป็นเครื่องมือแยกคุณลักษณะที่เราจะใช้เพื่อแยกคุณลักษณะออกจากรูปภาพ
เช่นเดียวกับที่เราทำในตัวอย่างก่อนหน้านี้ มาสร้างตารางและกำหนดป้ายกำกับให้กับตารางกัน ข้ามไปที่ Classification Learner และเริ่มฝึกแบบจำลองของเรา มาดูข้อมูลของเรากัน เรามีฟีเจอร์ใหม่ 200 รายการที่ดึงมาจากรูปภาพ และตัวแปรสุดท้ายคือการตอบสนอง ฉันจะเลือก Holdout เป็นการตรวจสอบอีกครั้ง และตอนนี้ฉันพร้อมที่จะเริ่มฝึกโมเดลแล้ว
ฉันจะฝึกโมเดลสองสามตัวอย่างรวดเร็ว โดยเริ่มจากเพื่อนบ้านที่ใกล้ที่สุดและเครื่องเวกเตอร์ที่รองรับ ตอนนี้ฉันได้รับการฝึกฝนไม่มากก็น้อยแล้ว มาทำการวินิจฉัยด้วยภาพอย่างรวดเร็วโดยใช้เมทริกซ์ความสับสน เมทริกซ์ความสับสนส่วนใหญ่จะเป็นเส้นทแยงมุม ซึ่งนั่นเป็นสิ่งที่ดี และเราจะส่งออกโมเดลเหล่านี้อย่างรวดเร็วและดูว่ามันทำงานอย่างไรกับภาพสตรีมมิ่งจริง
ก่อนที่ฉันจะเรียกใช้ฟังก์ชันนี้ ฉันต้องการแสดงรหัสและความง่ายในการรับภาพสตรีมมิ่งและจัดประเภทภาพตามเวลาจริง ฟังก์ชันใช้สองอินพุต อย่างแรกคือโมเดลรถไฟ และอย่างที่สองคือออบเจกต์ที่มีฟีเจอร์มากมาย ซึ่งฉันจะใช้เพื่อแยกฟีเจอร์ออกจากภาพใหม่
การเริ่มต้นเว็บแคมเป็นเรื่องง่าย สิ่งที่ฉันต้องทำคือเรียกคำสั่ง Webcam ภายในลูปที่ทำงานอย่างต่อเนื่อง ขั้นแรก ฉันได้สแน็ปช็อตจากเว็บแคมแล้วแปลงเป็นโทนสีเทา ซึ่งหมายความว่าโมเดลควรจะสามารถระบุรถยนต์ได้โดยไม่ต้องใช้ข้อมูลสี ขั้นตอนต่อไปคือการดึงคุณลักษณะต่างๆ จากรูปภาพใหม่นี้ และสุดท้าย ใช้ฟังก์ชันการทำนายและโมเดลที่ได้รับการฝึกฝนเพื่อคาดการณ์เกี่ยวกับรูปภาพใหม่ กลับไปเรียกใช้ฟังก์ชันนี้กันเถอะ
พล็อตด้านบนนี้แสดงภาพจากเว็บแคมของฉัน และแถบสีเขียวตรงนี้คือผลลัพธ์ของแบบจำลองที่คาดการณ์ในภาพนี้ นี่คือตัวแยกประเภทที่ฉันใช้ และแผนภูมิแท่งนี้แสดงให้เห็นว่าตัวแยกประเภทมีความมั่นใจเพียงใดว่ารถคันนี้เป็นของ Lightning, Mater, Nigel หรือ Sand Dune ลองเลื่อนกล้องไปรอบๆ เพื่อดูว่าตัวแบบทำงานอย่างไรในมุมและการวางแนวต่างๆ
ดังนั้นโมเดลจึงได้รับสิทธิจาก Lightning เป็นส่วนใหญ่ แต่เมื่อเราย้ายไปที่ Nigel คุณจะเห็นว่าโมเดลไม่มั่นใจอย่างสมบูรณ์ว่าเป็นรถรุ่นใด แผนภาพความน่าจะเป็นด้านล่างแสดงให้คุณเห็นว่าโมเดลมีความมั่นใจเพียงใดในการทำนายว่ารถคันนี้คือคันใด นี่คือ Sand Dune และสุดท้ายคือ Mater
ลองส่งออกโมเดลอื่นจาก Classification Learner และดูว่าโมเดลทั้งสองทำงานเคียงข้างกันอย่างไร ฉันจะใช้ Linear SVM และเลือกส่งออกด้วยชื่อเริ่มต้น ตอนนี้ฉันมีตัวแยกประเภทสองตัว หรือสองรุ่นในพื้นที่ทำงานของฉัน หนึ่งคือเคเอ็นเอ็น อีกอันคือเครื่องเวกเตอร์ที่รองรับ
ตอนนี้ให้ฉันเรียกใช้โค้ดชิ้นนี้ซึ่งเปรียบเทียบประสิทธิภาพของตัวแยกประเภทสองตัวนี้เคียงข้างกัน สิ่งที่เราเห็นอีกครั้งที่นี่คือวิดีโอเปรียบเทียบประสิทธิภาพของตัวแยกประเภทสองตัวแบบเคียงข้างกัน ที่ด้านบนซ้ายเป็นสีแดงคือประสิทธิภาพของตัวแยกประเภท SVM ของเรา และที่ด้านล่างขวาคือประสิทธิภาพของตัวแยกประเภท KNN สิ่งสำคัญที่ควรทราบในที่นี้ไม่ใช่แค่การเปรียบเทียบและทดสอบโมเดลใน Classification Learner ที่ง่ายเท่านั้น แต่ยังง่ายพอๆ กับการส่งออกโมเดลเหล่านี้ไปยัง MATLAB และทดสอบแบบเรียลไทม์
นั่นนำเราไปสู่จุดสิ้นสุดของการสาธิตนี้ เรามาเปลี่ยนกลับไปที่งานนำเสนอของเรากัน มาสรุปสิ่งที่เราเพิ่งทำสำเร็จอีกครั้งโดยใช้ไดอะแกรมเวิร์กโฟลว์ที่เราคุ้นเคย
อินพุตของเราประกอบด้วยภาพที่มีป้ายกำกับหลายภาพบนดิสก์ เราใช้วิธีถุงคำเพื่อสร้างคุณสมบัติใหม่ จากนั้นเราใช้แอป Classification Learner เพื่อให้ได้แบบจำลองที่ดีที่สุดของเรา สำหรับขั้นตอนการคาดคะเน เราได้รับข้อมูลใหม่จากเว็บแคม เข้ารหัสรูปภาพและคุณสมบัติใหม่ และใช้โมเดลที่ผ่านการฝึกอบรมเพื่อทำการคาดคะเนตามเวลาจริง
สิ่งนี้นำเราไปสู่บทสรุปและประเด็นสำคัญ เพื่อสรุปสิ่งที่เราได้เห็นไปแล้ว ให้ฉันย้อนกลับไปที่ความท้าทายที่ฉันได้ตั้งไว้ในตอนต้นของงานนำเสนอนี้ หวังว่าคุณจะได้เห็นในวันนี้ว่า MATLAB สามารถจัดการกับความท้าทายเหล่านี้ได้อย่างไร
สำหรับความท้าทายแรกของความหลากหลายของข้อมูล เราได้เห็นว่า MATLAB สามารถทำงานกับข้อมูลประเภทต่างๆ ได้อย่างไร MATLAB ยังสามารถเข้าถึงและดาวน์โหลดฟีดข้อมูลทางการเงิน ทำงานกับข้อความ ข้อมูลเชิงพื้นที่ และข้อมูลรูปแบบอื่นๆ MATLAB ยังมีไลบรารีของอัลกอริธึมและฟังก์ชันมาตรฐานอุตสาหกรรมที่ผ่านการตรวจสอบแล้ว MATLAB ยังมีเครื่องมือเพิ่มเติมสำหรับเวิร์กโฟลว์วิศวกรรมเฉพาะในด้านการเงิน การประมวลผลสัญญาณ การประมวลผลภาพ และอื่นๆ อีกมากมาย
นอกจากนี้ เรายังได้เห็นวิธีที่เราสามารถสร้างและสร้างต้นแบบโซลูชันได้อย่างรวดเร็ว ซึ่งโต้ตอบกับเวิร์กโฟลว์ที่ขับเคลื่อนด้วยแอป ซึ่งช่วยให้คุณมุ่งเน้นไปที่การเรียนรู้ของเครื่อง ไม่ใช่การเขียนโปรแกรมและการดีบัก แนวทางปฏิบัติที่ดีที่สุดสำหรับแมชชีนเลิร์นนิง เช่น เครื่องมือตรวจสอบความถูกต้องระหว่างกันและการประเมินโมเดล จะรวมอยู่ในแอปและฟังก์ชันต่างๆ ดังที่เราเห็น MATLAB ยังมีเอกสารประกอบมากมายที่มีหลักเกณฑ์มากมายที่ช่วยให้คุณเลือกเครื่องมือที่เหมาะสมสำหรับงาน ประการสุดท้าย MATLAB เป็นสภาพแวดล้อมการสร้างแบบจำลองที่ยืดหยุ่นโดยเนื้อแท้และเป็นภาษาโปรแกรมที่สมบูรณ์โดยไม่มีข้อจำกัดในการปรับแต่งที่คุณสามารถทำได้ในการวิเคราะห์ของคุณ สิ่งนี้ทำให้ MATLAB เป็นแพลตฟอร์มที่ยอดเยี่ยมสำหรับการเรียนรู้ของเครื่อง
สิ่งนี้นำเราไปสู่จุดสิ้นสุดของการนำเสนอ และฉันจะพยายามทำให้สั้นและกระชับ ฉันต้องการแชร์หลักเกณฑ์บางอย่างเกี่ยวกับเวลาที่คุณควรพิจารณาแมชชีนเลิร์นนิง ลองใช้แมชชีนเลิร์นนิงหากคุณกำลังแก้ปัญหาที่กฎและสมการที่เขียนด้วยลายมือซับซ้อนเกินไปหรือสร้างไม่ได้ หรือเมื่อกฎของงานของคุณมีการเปลี่ยนแปลงอยู่เสมอ และโปรแกรมหรือโมเดลของคุณจำเป็นต้องปรับเปลี่ยนอยู่เสมอ เนื่องจากงานของคุณเป็นเป้าหมายที่เคลื่อนไหว หรือเมื่อธรรมชาติของข้อมูลของคุณเปลี่ยนไป และโปรแกรมจำเป็นต้องปรับตัวอยู่เสมอ
และหวังว่าฉันจะสามารถโน้มน้าวใจคุณได้ว่า MATLAB เป็นแพลตฟอร์มที่ทรงพลังสำหรับทุกขั้นตอนของเวิร์กโฟลว์แมชชีนเลิร์นนิง เราสนใจที่จะรับฟังความคิดเห็นจากคุณเสมอ และคุณสามารถค้นหาข้อมูลติดต่อของฉันได้ในหน้าผลิตภัณฑ์กล่องเครื่องมือสถิติและการเรียนรู้ของเครื่อง หากคุณสนใจที่จะเรียนรู้เพิ่มเติม โปรดดูเอกสารประกอบของผลิตภัณฑ์ มีตัวอย่างและหน้าแนวคิดมากมายที่ไม่เพียงช่วยให้คุณเริ่มต้นได้ แต่ยังแนะนำคุณเมื่อคุณเชี่ยวชาญในเครื่องมือต่างๆ
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับอัลกอริทึม พื้นที่ใช้งาน ตัวอย่าง และการสัมมนาผ่านเว็บที่เกี่ยวข้องกับแมชชีนเลิร์นนิง โปรดไปที่หน้าแมชชีนเลิร์นนิง สิ่งนี้นำเราไปสู่จุดสิ้นสุดของเซสชันนี้ ขอบคุณทุกท่านที่รับฟัง
FAQs
การเรียนรู้ของเครื่องมีอะไรบ้าง ›
โดยหลักการของ Machine Learning จะแบ่งออกเป็น 3 ประเภทตามรูปแบบการเรียนรู้ด้วยกัน นั่นก็คือ supervised learning, unsupervised learning และ Reinforcement Learning.
การเรียนรู้ของเครื่อง (machine learning) หมายถึงข้อใด ›การเรียนรู้ของเครื่องหรือ machine learning นั้น เป็นรูปแบบหนึ่งของการวิเคราะห์ข้อมูล ที่ดำเนินการวิเคราะห์ด้วยแบบจำลองอย่างเป็นอัตโนมัติ ซึ่งเป็นสาขาหนึ่งของเทคโนโลยีด้าน AI (artificial intelligence) ซึ่งตั้งอยู่บนรากฐานแนวคิดที่ว่า ระบบต่าง ๆ นั้น สามารถที่จะเรียนรู้และมีปฏิสัมพันธ์กับชุดข้อมูลต่าง ๆ รวมถึงสามารถระบุ ...
Machine Learning คืออะไร และ ยกตัวอย่าง ในชีวิตประจําวัน ›Machine Learning แบบเข้าใจง่ายๆ
เครื่องจักรจะทำการเรียนรู้ จดจำ เมื่อพบสิ่งใดที่มีลักษณะคล้ายกับสิ่งที่เคยถูกกำหนดไว้ เช่น สัตว์สี่ขาร้องโฮ่ง จะถูกระบุว่าเป็นสุนัข ถ้าเกิดผิด ทางเครื่องจักรก็จะทำการระบุว่าสาเหตุใดจึงผิด และทำการเรียนรู้ต่อไปเรื่อยๆ
Machine Learning เรียนรู้จากสิ่งที่เราส่งเข้าไปกระตุ้น แล้วจดจำเอาไว้เป็นมันสมอง ส่งผลลัพธ์ออกมาเป็นตัวเลข หรือ code ที่ส่งต่อไปแสดงผล หรือให้เจ้าตัว AI นำไปแสดงการกระทำ Machine Learning เองสามารถเอาไปใช้งานได้หลายรูปแบบ ต้องอาศัยกลไกที่เป็นโปรแกรม หรือเรียกว่า Algorithm ที่มีหลากหลายแบบ โดยมี Data Scientist เป็นผู้ ...
นักวิทยาศาสตร์ข้อมูล (Data Scientist) คืออะไร ›Data Scientist คือ ผู้รวบรวมข้อมูลและวิเคราะห์ข้อมูลทั้ง 2 รูปแบบ คือ รูปแบบข้อมูลเชิงโครงสร้าง (Structure Data) เป็นตารางข้อมูลที่มีการจัดการอย่างชัดเจน เป็นระเบียบสามารถนำมาใช้ในการวิเคราะห์ต่อได้ทันที และสำหรับข้อมูลที่ไม่มีโครงสร้างแน่นอน (Unstructured Data) จะเป็นข้อความเสียง, รูปภาพและวีดิโอ เป็นต้น
AI คืออะไร ยกตัวอย่าง ›ปัญญาประดิษฐ์ (AI : Artificial Intelligence) คือเครื่องจักร (machine) ที่มีฟังก์ชันทีมีความสามารถในการทำความเข้าใจ เรียนรู้องค์ความรู้ต่างๆ อาทิเช่น การรับรู้ การเรียนรู้ การให้เหตุผล และการแก้ปัญหาต่างๆ เครื่องจักรที่มีความสามารถเหล่านี้ก็ถือว่าเป็น ปัญญาประดิษฐ์ (AI : Artificial Intelligence) นั่นเอง
การเรียนรู้เชิงลึก (Deep Learning) มีลักษณะอย่างไร ›การเรียนรู้เชิงลึกคือการเรียนรู้ของเครื่องซึ่งเป็นการฝึกฝนคอมพิวเตอร์ให้สามารถทำงานได้เหมือนมนุษย์ เช่น การจดจำคำพูด การระบุภาพ หรือการคาดการณ์ แทนที่จะจัดระเบียบข้อมูลที่จะรันผ่านทางสมการที่กำหนดไว้ล่วงหน้า การเรียนรู้เชิงลึกจะกำหนดค่าพารามิเตอร์พื้นฐานเกี่ยวกับข้อมูลและฝึกให้คอมพิวเตอร์เรียนรู้ด้วยตัวเองโดยการจดจำรูป ...
Machine Learning แบบใดเหมาะสำหรับการจัดกลุ่มพฤติกรรมลูกค้า ›Clustering การจัดกลุ่มข้อมูลตามคุณลักษณะ เช่น การจัดกลุ่มลูกค้าตามพฤติกรรมการซื้อของ
Unsupervised Learning มีลักษณะอย่างไร ›การเรียนรู้โดยไม่มีผู้สอน (Unsupervised Learning) เป็นการเรียนรู้ที่ให้เครื่องจักรนั้นสามารถเรียนรู้ได้ด้วยตนเอง โดยไม่ต้องมีค่าเป้าหมายของแต่ละข้อมูล ซึ่งวิธีการคือมนุษย์จะเป็นผู้ใส่ข้อมูลต่าง ๆ และกำหนดสิ่งที่ต้องการจากข้อมูลเหล่านั้น โดยให้เครื่องจักรวิเคราะห์จากการจำแนกและสร้างแบบแผนจากข้อมูลที่ได้รับมา โดยตัวอย่าง ...
Machine learning มีประโยชน์อะไรบ้าง ›ทำไมเราจึงต้องใช้ Machine Learning ? เพื่อทำให้ชีวิตเราง่ายขึ้น เพื่อช่วยจัดการกับความเสี่ยงต่างๆ ได้อย่างมีประสิทธิภาพ เช่น สถาบันการเงินที่นำไปใช้เพื่อลดอัตราการผิดนัดชำระของลูกค้า เพิ่มอัตราการติดตามทวงถามหนี้หรือเพิ่มจำนวนลูกค้า เป็นต้น
วัตถุประสงค์ของการทำ Machine Learning คืออะไร ›
วัตถุประสงค์หลักของ Machine Learning คือ การเรียนรู้ (learning) และการอนุมาน (inference) สิ่งแรกคือ machine จะเรียนรู้ผ่านการค้นพบรูปแบบหรือแบบแผนซ้ำ ๆ เดิม ๆ การค้นพบต้องขอบคุณถึงการมีอยู่ข้อมูล (data) ส่วนหนึ่งที่สำคัญของนักวิทยาศาสตร์ข้อมูล (data scientist) จะเป็นการเลือกอย่างระมัดระวังว่าข้อมูลไหนสนับสนุนกับเครื่อง ...
การประยุกต์ใช้ AI ในปัจจุบันมีอะไรบ้าง ›- 1.การปลดล็อคหน้าจอโทรศัพท์ด้วย Face ID.
- 2.โซเชียลมีเดีย
- 3.การส่งอีเมล์ หรือข้อความต่างๆ
- 4.การค้นหาบน Google.
- 5.การสั่งงานด้วยเสียง
- 6.อุปกรณ์สมาร์ทโฮม
- 7.การเดินทางไปทำงาน
- 8.ธุรกรรมทางการเงิน
สรุปความแตกต่าง Machine Learning กับ Deep Learning
Machine Learning ใช้อัลกอริทึมที่ประมวลผลจากข้อมูล เรียนรู้จากข้อมูลและนำไปสู่การตัดสินใจที่มีพื้นฐานมาจากข้อมูลที่ป้อนเข้าไป โครงสร้างอัลกอริทึมของ Deep Learning จะสร้าง “Artificial Neural Network” ที่สามารถเรียนรู้และตัดสินใจอย่างชาญฉลาดด้วยตนเองได้
Machine Learning (ML) : การสอนให้ระบบคอมพิวเตอร์ทำการเรียนรู้ได้ด้วยตนเองโดยการใช้ 'ข้อมูล' อาจจะทำความเข้าใจง่าย ๆ ตามชื่อเลยก็คือ การสอนอัลกอริทึมให้เรียนรู้ทำความเข้าใจและตัดสินใจได้ด้วยตัวเองจาก 'ข้อมูล' ที่ป้อนให้
Machine learning ใช้การใช้ภาษาอะไรเขียน ›ภาษาที่ใช้ในการพัฒนา(Programming Language)
ภาษาในที่นี้ไม่ใช่ภาษาที่ใช้พูดกันระหว่างมนุษย์กับมนุษย์ แต่เป็นภาษที่มนุษย์ใช้สื่อสารกับคอมพิวเตอร์เพื่อพูดคุยสื่อสารไปในรูปแบบเดียวกัน นั่นคือภาษา Python ที่ตอนนี้เป็นที่นิยมใช้กันมากในการทำ Machine Learning(ML)
ผู้ที่ทำงานด้าน Data Scientist ต้องจบสาขาอะไร
มหาวิทยาลัยธรรมศาสตร์ คณะวิทยาศาสตร์ สาขาวิชาวิทยาศาสตร์และนวัตกรรมข้อมูล (https://cis.tu.ac.th/dsi) สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง คณะเทคโนโลยีสารสนเทศ สาขาวิชาวิทยาการข้อมูลและการวิเคราะห์เชิงธุรกิจ (https://www.it.kmitl.ac.th/th/program/datasci-program/)
สายงาน Data Analyst เหมาะกับคนที่สนใจทำงานด้าน Data เป็นอย่างยิ่งครับ คนที่สนใจด้านนี้จำเป็นต้องใช้สกิลการวิเคราะห์ข้อมูล และ Technical Skill ที่เรียนได้จากคอร์สที่น้องเกิ้ลแนะนำไปก่อนหน้านี้ครับ ที่สำคัญ คือ ต้องฝึกการสื่อสารภาษา Technical ออกมาเป็นภาษาที่คนทั่วไปสามารถเข้าใจได้ครับ
Data Scientist ใช้โปรแกรมอะไรบ้าง ›Microsoft Excel หรือ Google Sheets เป็นโปรแกรมที่มีประโยชน์มากสำหรับขั้นตอน Exploratory Data Analysis (EDA) แต่อย่างที่เล่าไปก่อนหน้าว่า Data Scientist นิยมใช้ Python มากกว่า แต่ก็ควรมีทักษะในการใช้โปรแกรม Spreadsheet ติดตัวไว้ด้วย เผื่อในบางสถานการณ์ที่ข้อมูลอาจไม่เยอะมาก การใช้โปรแกรม Spreadsheet อาจเร็วกว่าการใช้ ...
AI แบ่งออกเป็นกี่ประเภท อะไรบ้าง ›ชนิดของ AI (Type of Artificial Intelligence) AI ถูกแบ่งออกเป็น 3 sub field ได้แก่ 1) ปัญญาประดิษฐ์ (Artificial Intelligence) 2) การเรียนรู้ของเครื่อง (Machine learning) 3) การเรียนรู้เชิงลึก (Deep Learning)
AI คืออะไร มีหลักการทำงานอย่างไร ›AI ย่อมาจาก Artificial Intelligence ภาษาไทย คือ ปัญญาประดิษฐ์ ถ้าจะสื่อสารกันให้ถูกต้อง AI คือ ระบบประมวลผล ที่มีการวิเคราะห์เชิงลึก คล้ายความฉลาดของมนุษย์ และสามารถก่อให้เกิดผลลัพธ์ที่เป็นการกระทำได้ เช่น การแปลภาษา เกิดจากการประมวลผลจากข้อความรับเข้า แล้วแปลงออกมาเป็นอีกภาษาหนึ่ง เป็นต้น
Artificial Intelligence คือ อะไร สําคัญอย่างไร ›
ความสำคัญของ AI ในโลกปัจจุบัน
AI ย่อมาจาก Artificial Intelligence[1] โดยภาษาไทยใช้คำว่า ปัญญาประดิษฐ์[2] หมายถึง ระบบประมวลผลของคอมพิวเตอร์ หุ่นยนต์ เครื่องจักร หรืออุปกรณ์อิเล็กทรอนิกส์ต่าง ๆ ที่มีการวิเคราะห์เชิงลึกคล้ายความฉลาดของมนุษย์ และสามารถก่อให้เกิดผลลัพธ์ที่เป็นการกระทำได้
การเรียนรู้เชิงรุก (Active Leaning) คือ กระบวนการจัดการเรียนรู้ที่ผู้เรียนได้ลงมือกระทำและได้ใช้ กระบวนการคิดเกี่ยวกับสิ่งที่เขาได้กระทำลงไป ซึ่งการจัดกิจกรรมการเรียนรู้ภายใต้สมมติฐานพื้นฐาน 2 ประการคือ 1) การเรียนรู้เป็นความพยายามโดยธรรมชาติของมนุษย์ และ 2) แต่ละบุคคลมีแนวทางในการ เรียนรู้ที่แตกต่างกัน (Meyers and ...
Machine Learning แบบใดเรียนรู้ได้เองตามสภาพแวดล้อมจริง ›ในบรรดา Machine Learning ทั้งหมด Reinforcement Learning คือสิ่งที่ดูเป็น Artificial Intelligence (AI) ที่แท้ทรู ที่สุด เพราะจะเรียนรู้และเปลี่ยนไปตามสิ่งแวดล้อม
ใครคือคนแรกที่ใช้คําว่า ปัญญาประดิษฐ์ (Artificial Intelligence) ›AI (Artificial Intelligence)
ถูกสร้างขึ้นมาครั้งแรกในช่วงปี ค.ศ. 1956 (พ.ศ. 2499) โดย John McCarthy นักวิทยาศาสตร์คอมพิวเตอร์ชาวอเมริกัน ผู้ที่ได้ชื่อว่าเป็นบิดาแห่ง “ปัญญาประดิษฐ์” ซึ่งเขาได้ต่อยอดแนวคิดของ Alan Turing ที่จุดประเด็นเรื่องความคิดแบบมนุษย์ ในเครื่องจักร จนสามารถสร้าง AI ตัวแรกขึ้นมาได้สําเร็จ
Deep Learning สามารถแบ่งคร่าวๆ เป็น สองประเภท คือ Feedforward Neural Network ที่ข้อมูลสามารถผ่านหน่วยประมวลผลได้เพียงทางเดียว ไม่ได้นำข้อมูลผลลัพธ์มาใช้ซ้ำ และ Recurrent Neural Network ที่ข้อมูลก่อนหน้าจะถูกนำกลับมาใช้ใหม่เพื่อคาดการณ์ผลลัพธ์ที่จะเกิดขึ้นในอนาคต
Machine Learning Classification มีอะไรบ้าง ›โดย Machine Learning ถูกแบ่งออกเป็น 2 ประเภท คือ 1.Supuervised Learning 2.Unsupervised Learning ข้างในก็จะมีโมเดลต่างๆอีกมากมายให้เราเลือกใช้
การที่ Machine Learning เรียนรู้จาก Data จะให้ผลลัพธ์ออกมา ตรงกับข้อใด ›Machine Learning เรียนรู้จากสิ่งที่เราส่งเข้าไปกระตุ้น แล้วจดจำเอาไว้เป็นมันสมอง ส่งผลลัพธ์ออกมาเป็นตัวเลข หรือ code ที่ส่งต่อไปแสดงผล หรือให้เจ้าตัว AI นำไปแสดงการกระทำ Machine Learning เองสามารถเอาไปใช้งานได้หลายรูปแบบ ต้องอาศัยกลไกที่เป็นโปรแกรม หรือเรียกว่า Algorithm ที่มีหลากหลายแบบ โดยมี Data Scientist เป็นผู้ ...
การเรียนรู้ของเครื่อง (machine learning หรือ ML) สามารถแบ่งออกเป็นกี่แบบ มีอะไรบ้าง ›โดยหลักการของ Machine Learning จะแบ่งออกเป็น 3 ประเภทตามรูปแบบการเรียนรู้ด้วยกัน นั่นก็คือ supervised learning, unsupervised learning และ Reinforcement Learning.
การเรียนรู้แบบ Supervised Learning เหมาะสำหรับงานประเภทใด ›Supervised Learning เป็นการเรียนรู้ข้อมูลต่าง ๆ โดยมีผู้สอน อาศัยข้อมูลในการฝึกฝน เพื่อช่วยให้ตัวเทคโนโลยีสามารถเรียนรู้ผล และคาดคะเนผลลัพธ์ต่าง ๆ ได้อย่างแม่นยำมากยิ่งขึ้น โดยการเรียนรู้ในรูปแบบนี้ มักถูกนำมาใช้งานในเชิงธุรกิจทั้งการคำนวณราคาบ้าน การคาดคะเนค่าเงิน หรือแม้แต่การวิเคราะห์ผลการแข่งขันต่าง ๆ เป็นต้น
AI และ Machine Learning มีความสำคัญอย่างไร ›AI เป็นกระบวนการทำให้คอมพิวเตอร์มีปัญญา สามารถทำสิ่งต่างๆ ได้คล้ายๆ กับคน ส่วน Machine Learning จะเป็นหนึ่งในกระบวนการเรียนรู้ของ AI เพื่อให้ได้ผลลัพธ์ตามที่ต้องการ AI มีบทบาทอย่างมากในชีวิตประจำวัน ตั้งแต่การเก็บข้อมูล เสนอขายสินค้า ตอบคำถามของลูกค้า ไปจนถึงการวิเคราะห์การซื้อขายของผู้ประกอบการ
ข้อใดคือความแตกต่างระหว่างการเรียนรู้แบบมีผู้สอนและการเรียนรู้แบบไม่มีผู้สอน ›
การเรียนรู้แบบไม่มีผู้สอน (อังกฤษ: unsupervised learning) เป็นเทคนิคหนึ่งของการเรียนรู้ของเครื่อง โดยการสร้างโมเดลที่เหมาะสมกับข้อมูล การเรียนรู้แบบนี้แตกต่างจากการเรียนรู้แบบมีผู้สอน คือ จะไม่มีการระบุผลที่ต้องการหรือประเภทไว้ก่อน การเรียนรู้แบบนี้จะพิจารณาวัตถุเป็นเซตของตัวแปรสุ่ม แล้วจึงสร้างโมเดลความหนาแน่นร่วมของ ...
ข้อใดเป็นขั้นตอนแรกในการทำ Machine Learning ›- 1. ตรวจเช็ค data ของเรา ...
- 2. การเลือก Feature. ...
- 3. ทำการ Centering and scaling. ...
- 4. เลือกใช้โมเดล ...
- 5. การปรับ parameter. ...
- 6. เอาทุกอย่างมารวมกันด้วย pipeline. ...
- 7. ทำการประเมินผลของโมเดล
ปัญญาประดิษฐ์ช่วยเพิ่มความเร็ว ความแม่นยำและประสิทธิผลแก่ความพยายามในการทำงานของบุคคล ในสถาบันการเงิน ความสามารถของ AI ช่วยในการระบุธุรกรรมที่มีแนวโน้มส่อไปในทางทุจริต ปรับเปลี่ยนได้อย่างรวดเร็วและมีการให้คะแนนความน่าเชื่อถือที่แม่นยำ รวมถึงจัดการงานด้านการจัดการข้อมูลแบบอัตโนมัติที่มีปริมาณมากได้ดี
ผลเสียของAI มีอะไรบ้าง ›สิ่งที่อาจเกิดขึ้นได้จากเทคโนโลยีปัญญาประดิษฐ์ในปัจจุบัน เช่น พวกมันอาจเกิดข้อผิดพลาดในการคำนวณได้จากการรับข้อมูลที่ไม่ถูกต้องเมื่อเกิดความผิดพลาดปัญญาประดิษฐ์จะไม่สามารถตัดสินใจด้วยตัวเองได้ว่าจะหยุดหรือทำงานต่อไป หากไม่มีมนุษย์คอยควบคุมอาจเกิดความเสียหายต่อสายการผลิตได้ เทคโนโลยีปัญญาประดิษฐ์ที่มีความซับซ้อนยังใช้ ...
ทำไม Deep Learning ถึงเป็นที่นิยม ›จริง ๆ เรามองว่า สาเหตุที่ Deep Learning มันพึ่งมาบูมเมื่อไม่กี่ปีที่ผ่านมาเกิดจาก 2 ส่วนคือ ข้อมูลที่มีมากขึ้นเยอะมาก ๆๆๆๆๆ เพราะคนสามารถเข้าถึง Internet ได้มากขึ้น User Generated Content (UGC) ก็เพิ่มขึ้นเป็นเงาตามตัว และ เครื่องคอมพิวเตอร์ที่มีประสิทธิภาพสูงมากขึ้นพอที่จะรันอะไรแบบนี้ได้
ทำไมต้องใช้ Machine Learning ›ทำไมเราจึงต้องใช้ Machine Learning ? เพื่อทำให้ชีวิตเราง่ายขึ้น เพื่อช่วยจัดการกับความเสี่ยงต่างๆ ได้อย่างมีประสิทธิภาพ เช่น สถาบันการเงินที่นำไปใช้เพื่อลดอัตราการผิดนัดชำระของลูกค้า เพิ่มอัตราการติดตามทวงถามหนี้หรือเพิ่มจำนวนลูกค้า เป็นต้น
Machine Learning ช่วยในด้านอะไรบ้าง ›Machine Learning ยังถูกใช้กับงานหลากหลายด้าน เช่น การตรวจจับการฉ้อโกง ( Fraud detection ) , การพยากรณ์เพื่อปรับปรุงแก้ไข (Predictive Maintenance) , การเพิ่มประสิทธิภาพในการถือหุ้น (Portfolio optimization) , การทำงานอัตโนมัติ และอื่น ๆ
การเรียนรู้ของเครื่อง (machine learning) ต่างจากการเรียนรู้เชิงลึก (Deep Learning) อย่างไร ›สรุปความแตกต่าง Machine Learning กับ Deep Learning
Machine Learning ใช้อัลกอริทึมที่ประมวลผลจากข้อมูล เรียนรู้จากข้อมูลและนำไปสู่การตัดสินใจที่มีพื้นฐานมาจากข้อมูลที่ป้อนเข้าไป โครงสร้างอัลกอริทึมของ Deep Learning จะสร้าง “Artificial Neural Network” ที่สามารถเรียนรู้และตัดสินใจอย่างชาญฉลาดด้วยตนเองได้
- 1. เข้าใจปัญหาที่เผชิญอย่างถ่องแท้ ขั้นแรก เราต้องเข้าใจปัญหาที่ต้องการแก้เสียก่อน ฟังดูเหมือนง่าย แต่บางครั้งเราก็ไม่ได้ทำอย่างนั้น เช่น ...
- 2. รวบรวมข้อมูล ...
- 3. ทำความเข้าใจข้อมูล ...
- 4. เตรียมข้อมูลสำหรับโมเดล ...
- 5. เลือกและสอนโมเดล ...
- 6. Fine-tune โมเดล ...
- 7. นำโมเดลไปใช้งานจริง
Share. Confusion Matrix ถือเป็นเครื่องมือสำคัญในการประเมินผลลัพธ์ของการทำนาย หรือ Prediction ที่ทำนายจากModelที่เราสร้างขึ้น ในMachine learning โดยมีไอเดียจากการวัดว่า สิ่งที่เราคิด (Model ทำนาย) กับ สิ่งที่เกิดขึ้นจริง มีสัดส่วนเป็นอย่างไร
Deep Learning ใช้ทำอะไร ›
Deep Learning คือวิธีการเรียนรู้แบบอัตโนมัติด้วยการ เลียนแบบการทำงานของโครงข่ายประสาทของมนุษย์ (Neurons) โดยนำระบบโครงข่ายประสาท (Neural Network) มาซ้อนกัน หลายชั้น (Layer) และทำการเรียนรู้ข้อมูลตัวอย่าง ซึ่งข้อมูล ดังกล่าวจะถูกนำไปใช้ในการตรวจจับรูปแบบ (Pattern) หรือจัด หมวดหมู่ข้อมูล (Classify the Data)
อัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) และการเรียนรู้เชิงลึก (Deep Learning) แตกต่างกันอย่างไร ›สรุปความแตกต่าง Machine Learning กับ Deep Learning
Machine Learning ใช้อัลกอริทึมที่ประมวลผลจากข้อมูล เรียนรู้จากข้อมูลและนำไปสู่การตัดสินใจที่มีพื้นฐานมาจากข้อมูลที่ป้อนเข้าไป โครงสร้างอัลกอริทึมของ Deep Learning จะสร้าง “Artificial Neural Network” ที่สามารถเรียนรู้และตัดสินใจอย่างชาญฉลาดด้วยตนเองได้
Photo by Franck V. on Unsplash. ML algorithms แบ่งได้เป็น 3 ประเภท คือ 1) Supervised, 2) Unsupervised และ 3) Reinforcement Learning.
AI กับ machine learning ต่างกันยังไง ›AI เป็นกระบวนการทำให้คอมพิวเตอร์มีปัญญา สามารถทำสิ่งต่างๆ ได้คล้ายๆ กับคน ส่วน Machine Learning จะเป็นหนึ่งในกระบวนการเรียนรู้ของ AI เพื่อให้ได้ผลลัพธ์ตามที่ต้องการ AI มีบทบาทอย่างมากในชีวิตประจำวัน ตั้งแต่การเก็บข้อมูล เสนอขายสินค้า ตอบคำถามของลูกค้า ไปจนถึงการวิเคราะห์การซื้อขายของผู้ประกอบการ
Supervised และ Unsupervised Learning ต่างกันอย่างไร ›1. Supervised Learning จะมีต้นแบบที่เป็นเป้าหมาย หรือ Target ในขณะที่ Unsupervised Learning จะไม่มี Target เช่น การทำนายยอดขาย จะใช้ข้อมูลในอดีต ที่รู้ว่ายอดขายเกิดขึ้นจริงเท่าไหร่ เป็น Target และใช้ปัจจัยต่างๆ เป็นตัวแปร หรือ Input กรณีนี้จะเป็น Supervised Learning ประเภท Regression, การวิเคราะห์กลุ่มลูกค้าจากพฤติกรรม ...
False negative คืออะไร ›ผลลบลวง, ตรวจไม่พบ, ผลลบปลอม, ผลลบเทียม, ผลลบเทียม, ลบเทียม, ผลลบที่ไม่เป็นจริง [การแพทย์]
ค่า F1 คืออะไร ›F1-Score. F1-Score คือค่าเฉลี่ยแบบ harmonic mean ระหว่าง precision และ recall นักวิจัยสร้าง F1 ขึ้นมาเพื่อเป็น single metric ที่วัดความสามารถของโมเดล (ไม่ต้องเลือกระหว่าง precision, recall เพราะเฉลี่ยให้แล้ว) แทนค่าในสมการ F1 = 2 * ( (0.625 * 0.526) / (0.625 + 0.526) ) = 57.1%
Precision กับ Recall ต่างกันยังไง ›(3.2) Precision Score คือความแม่นย าของผลท านายจะสนใจผลท านายหรือPredictionค านวณเป็นค่า สัดส่วนกี่ % ตามสมการ 3.3. (3.3) Recallคือ การวัดค่าความแม่นย าอีกมิติหนึ่ง ที่สนใจผลลัพธ์กับที่เป็นของจริงด้วย เช่น มองว่าโมเดลนั้น ท านายถูกต้องกี่ % เมื่อเทียบกันกับของจริง ตามสมการ 3.4.