บทความ Machine Learning
ไม่ว่าจะ ข่าวสาร บทสัมภาษณ์ และ Digital Skill บนสื่อ
มีให้คุณได้อ่านบทความดี ๆ มากมายแล้วที่นี่
โดย: Kan Ouivirach
| Machine Learning
เล่น Machine Learning แบบชิลๆ กับ scikit-learn
ทำความรู้จักกับข้อมูล Iris Data Setการโหลดข้อมูลการเตรียมข้อมูลการสร้าง Machine Learning โมเดลการนำโมเดลไปจำแนกข้อมูล หรือทำนายผลการเรียนรู้ที่ดีที่สุดวิธีหนึ่งคือการลงมือทำ บทความนี้เราจะมาลองลงมือเล่น Machine Learning แบบชิลๆ กับ scikit-learn กัน ตั้งแต่การโหลดข้อมูล จนถึงการสร้างโมเดลเอาไปจำแนกข้อมูล หรือทำนายผลเลยhttps://scikit-learn.org/scikit-learn เป็น Machine Learning Library ในภาษา Python ที่เราสามารถเอาไปทำทั้ง Supervised Learning หรือ Unsupervised Learning ได้ (ไม่มี Reinforcement Learning นะ ทำไม?) แล้วเราถึงเลือกใช้ Library นี้มาลอง?เป็น Library ที่ออกแบบมาให้ง่ายต่อการใช้งาน มี Algorithm ใน Machine Learning ที่นิยมใช้กันอยู่ใน Library นี้มีเอกสารการใช้งานที่ดี อันนี้ดีงามจริงๆ เพราะว่ามีโค้ดตัวอย่างให้ด้วยมีแทบทุก Task ใน Machine Learning ให้ใช้ เช่น Classification, Regression, Clustering, Model Selection, Preprocessing และอื่นๆ อีกมากมายติดตั้งโดยการใช้คำสั่ง : pip install scikit-learnทำความรู้จักกับข้อมูล Iris Data Setรูปจาก UCI Machine Learning Repositoryขั้นตอนแรกสุดคือเราต้องมาทำความรู้จักกับข้อมูลที่เราจะเอามาเล่นก่อน เนื่องจากเราจะมาลองเล่นกันแบบชิลๆ เลยเอาข้อมูลดอก Iris มาก่อนเลย เป็นข้อมูลที่ง่าย และดูจะเป็นข้อมูลที่ผ่านมือทุกคนที่ทำงานในสายนี้มาแล้วเลยทีเดียว ซึ่งมันควรจะผ่านมือพวกเราด้วยเช่นกัน :Dโจทย์ของเราจากข้อมูลชุดนี้คือ เราจะต้องจำแนกจากข้อมูลให้ได้ว่าข้อมูลนั้นเป็นดอก Iris ชนิดไหน ระหว่าง Setosa, Versicolor หรือ Virginica ซึ่งข้อมูลที่เราจะได้มาจะมี ความยาวกับความกว้างของกลีบเลี้ยง (Sepal Length & Width) หน่วยเป็นเซนติเมตร (cm) และความยาวกับความกว้างของกลีบดอก (Petal Length & Width) หน่วยเป็นเซนติเมตร (cm) เช่นกันการโหลดข้อมูลความดีงามของ scikit-learn นั้นคือ เราสามารถลองเล่นข้อมูลมาตรฐานได้โดยไม่ต้องไปโหลดมาเอง ซึ่งข้อมูล Iris ก็รวมอยู่ในนั้น เราสามารถลองใช้ได้ตามนี้>>> from sklearn import neighbors, datasets>>> iris = datasets.load_iris()หน้าตาที่ได้ก็จะประมาณนี้>>> print(iris.data) [[5.1 3.5 1.4 0.2] [4.9 3. 1.4 0.2] [4.7 3.2 1.3 0.2] [4.6 3.1 1.5 0.2] [5. 3.6 1.4 0.2] [5.4 3.9 1.7 0.4] [4.6 3.4 1.4 0.3]…เราสามารถดูว่าข้อมูลแต่ละคอลัมน์คืออะไรได้ตามนี้>>> print(iris.feature_names)[‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’]ค่าพวกนี้เราเรียกว่า Feature ได้ครับ Feature คือข้อมูลที่เราคิดว่าจะนำไปแยกแยะสิ่งต่างๆ ที่เราต้องการจำแนก ยกตัวอย่างเช่น ถ้าเราต้องการจำแนกว่าข้อมูลไหนคือรถยนต์ ข้อมูลไหนคือรถมอเตอร์ไซค์ Feature หนึ่งที่เราจะใช้ก็อาจจะเป็น จำนวนล้อ ครับ ในที่นี้ข้อมูล Iris เราก็จะมี Feature เป็นจำนวน 4 Feature นั่นเองส่วนข้อมูลชนิดของดอก Iris จะถูกเก็บอยู่ใน iris.target ครับ>>> print(iris.target)[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2]ตัว scikit-learn จะแปลงค่ามาเป็นตัวเลขให้เราแล้ว พร้อมที่จะนำเอาไปสร้างโมเดล แต่ถ้าเราอยากรู้ว่าแต่ละตัวเลขหมายความว่าอะไร เราดูจาก iris.target_names ได้ครับ>>> print(iris.target_names)[‘setosa’ ‘versicolor’ ‘virginica’]โดย Setosa คือเลข 0 ส่วน Versicolor คือเลข 1 และ Virginica คือเลข 2 ตามลำดับ (index ของ List ใน Python เริ่มที่เลข 0)การเตรียมข้อมูลเพื่อให้ดูง่ายๆ จะขอเก็บ Feature ทั้ง 4 ค่าในตัวแปร X และข้อมูลชนิดของดอก Iris ในตัวแปร y ตามนี้>>> X, y = iris.data, iris.targetทีนี้เวลาที่เราจะสร้างโมเดล เราจะแบ่งออกเป็น 2 Phases โดย Phase ที่ 1 คือ Training และ Phase ที่ 2 คือ Prediction หรือ Testing ตามรูปด้านล่างครับรูป Supervised Classification จาก http://www.nltk.org/book/ch06.htmlตอนที่เราอยู่ Training Phase เราจะดึงเอา Feature จากข้อมูล (ทำ Feature Extracting) มาใส่ Machine Learning Algorithm ส่วนตอนที่เราอยู่ Testing Phase เราก็จะเอาข้อมูลที่ไม่เคยเห็นมาก่อน หรือข้อมูลที่เอาไว้ทดสอบ มาดึง Feature ด้วย วิธี Feature Extracting แบบเดียวกับที่เราทำใน Training Phase ย้ำนะครับ ต้องเป็นวิธี Feature Extracing แบบเดียวกันทีนี้เราจะต้องแบ่งข้อมูลออกเป็น 2 ส่วน สำหรับแต่ละ Phase ทำได้ดังนี้>>> from sklearn.model_selection import train_test_split>>> X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30)เรากำลังแบ่งข้อมูลสำหรับเอาไว้ทดสอบ (X_test กับ y_test) เป็นจำนวน 30% และที่เหลือเอาไว้สร้างโมเดล (X_train กับ y_train)การสร้าง Machine Learning โมเดลบทความนี้ขอเลือกใช้ k-nearest neighbors มาลองเล่น คร่าวๆ ก็คือว่า เรากำลังจะหาเพื่อนใกล้ๆ เรา (จำนวน k) แล้วดูว่าเพื่อนแบบไหนมีมากกว่ากัน เราก็จะไปกับเพื่อนกลุ่มนั้น ส่วนรายละเอียดเดี๋ยวจะมาเล่าให้อ่านในบทความต่อๆ ไปนะครับ :Dเราจะนำเอา X_train กับ y_train มาใช้ในขั้นตอนนี้ครับ ตามนี้เลย>>> from sklearn import neighbors>>> knn = neighbors.KNeighborsClassifier(n_neighbors=15)>>> knn.fit(X_train, y_train)KNeighborsClassifier(algorithm=’auto’, leaf_size=30, metric=’minkowski’, metric_params=None, n_jobs=1, n_neighbors=15, p=2, weights=’uniform’)จบ Training Phase.. ใช้โค้ดแค่ 3 บรรทัดเราก็ได้โมเดลเอาไปลองเล่นได้ล่ะครับ เย้~ บทความนี้เราเน้นชิลๆ ดังนั้นเราจะข้ามขั้นตอนพวก Evaluate หรือ Validate ไปก่อนนะครับการนำโมเดลไปจำแนกข้อมูล หรือทำนายผลขั้นตอนสุดท้ายของเราล่ะครับ เราจะนำโมเดลของเราไปใช้จำแนกข้อมูล หรือทำนายผล ขั้นตอนนี้เราจะเอา X_test กับ y_test มาใช้>>> from sklearn.metrics import accuracy_score>>> y_pred = knn.predict(X_test)>>> print(accuracy_score(y_test, y_pred))0.9555555555555556เรียบร้อยครับ ได้ความแม่นยำประมาณ 95.56%บทความนี้ไม่ได้กล่าวถึงขั้นตอนการติดตั้ง Environment ต่างๆ ให้ใช้งานนะครับ จุดประสงค์คืออยากจะให้เห็นภาพรวมว่าการทำ Machine Learning จะมีขั้นตอนประมาณไหนบ้าง ซึ่งจริงๆ ยังมีขั้นตอนอื่นอีกนะ เช่น Feature Engineering, Model Validation, Model Evaluation อะไรพวกนี้ สำหรับคนที่ไม่คุ้นกับโค้ดเลย ผมแนะนำให้ติดตั้ง Anaconda ครับ ซึ่งจะมี scikit-learn มาให้เรียบร้อยแล้ว เรากดใช้ Jupyter Notebook แล้วเอาโค้ดด้านบนไปรันได้เลยหวังว่าการเห็นภาพรวมแบบตั้งแต่ต้นจนจบ (end-to-end) แบบนี้ จะทำให้เข้าใจการทำ Machine Learning กันมากขั้นนะครับ
โดย: Kan Ouivirach
| Machine Learning
Machine เรียนรู้กันอย่างไร?
Machine เรียนรู้กันอย่างไร?การเรียนรู้ 3 รูปแบบหลัก- Supervised learning- Unsupervised learning- Reinforcement learningการนำเอาไปใช้แก้ปัญหาบทความที่ผ่านมา “เริ่มต้นเรียนรู้ Machine Learning อย่างไรให้สนุก?” (https://www.digitalskill.org/contents/5)  ได้พูดเกริ่นๆ ไว้หน่อยแล้วว่า Machine Learning เนี่ย หัวใจของมันคือส่วนของการ “Learning” ครับ บทความนี้ก็เลยอยากจะมาพูดถึงเรื่องนี้ไว้สักหน่อย  ;)Machine เรียนรู้กันอย่างไร?การเรียนรู้ของ Machine เนี่ย จริงๆ แนวทางก็เหมือนกับของคนเรานั่นแหละ เนื่องจากแต่ไหนแต่ไรมาเราก็มีความพยายามจะทำให้ Machine นั้นเหมือนคนเราให้ได้มากที่สุดอยู่แล้วเนอะ ทีนี้เวลาคนเราเรียนรู้อะไรสักอย่างเรามักจะแอบส่องคนอื่นว่าเค้าทำอะไรในสถานการณ์นั้นๆ แล้วถ้าเกิดเราเจอสถานการณ์นั้นบ้าง เราก็ตัดสินใจทำตามเค้าเลยมองหาข้อมูลสนับสนุนต่างๆ ในสถานการณ์หนึ่งๆ แล้วพยายามที่จะหาสิ่งที่ดีที่สุดมาช่วยในการตัดสินใจลองผิดลองถูก ถ้าผิดก็เจ็บตัว ถ้าถูกก็ทำต่อไปทั้ง 3 พฤติกรรมการเรียนรู้ของคนเหล่านี้จะพาเราเข้าสู่เรื่องของการเรียนรู้ของ Machine ที่จะพูดถึงล่ะการเรียนรู้ 3 รูปแบบหลักรูปแบบที่ 1 Supervised Learning หรือ “แอบส่องคนอื่นว่าเค้าทำอะไรในสถานการณ์นั้นๆ แล้วถ้าเกิดเราเจอสถานการณ์นั้นบ้าง เราก็ตัดสินใจทำตามเค้าเลย”สมการ Supervised Learningการเรียนรู้แบบนี้คือการ Supervise ตัว Machine ให้เรียนรู้ตามที่เราบอก จากสมการในรูปด้านบน จะได้ว่าถ้าเรามีฟังก์ชั่นอยู่ฟังก์ชั่นหนึ่ง ตอนที่เราสอนเครื่อง เราจะให้คู่ข้อมูล x กับ y เข้าไปเป็นจำนวนหนึ่ง ถ้าข้อมูลนั้นมีจำนวนมากพอ ตอนที่เราโยน x ตัวใหม่เข้าไป ฟังก์ชั่นนี้ก็จะสามารถไปหา y ที่เหมาะสมให้เราได้ยกตัวอย่างเช่น ถ้าเราให้ข้อมูลว่าสิ่งๆ หนึ่งมีหน้าตาน่ารัก มีขน หน้ากลมๆ หูตั้ง (x) สิ่งๆ นั้นคือ แมว (y) นะ จากนั้น ตอนที่เครื่องที่เราสอนเห็นข้อมูล x ของแมวตัวใหม่เข้ามา เครื่องจะสามารถบอกได้ว่าสิ่งๆ นั้นคือแมวSupervised Learning นี้เป็นการเรียนรู้ที่เราใช้แก้ปัญหาเกือบทุกปัญหาในโลกนี้เลยทีเดียวนะ ไม่ว่าจะเป็นปัญหา Face Detection/Recognition หรือ Self-Driving Car พวกนี้ เราก็จำเป็นต้อง Supervise ให้เครื่องรู้จักคำตอบที่เราป้อนให้มันด้วยแต่ก็มีข้อจำกัดที่เราต้องระลึกไว้ก็คือ Machine นั้นจะรู้จักแค่คำตอบที่เราเคย Supervise มันไปเท่านั้น เช่น ถ้าเราสอนเครื่องด้วยข้อมูลหมากับแมวไปเท่านั้น พอเวลาที่มีข้อมูลของวัวเข้ามา เครื่องจะไม่สามารถบอกได้ว่าสิ่งๆ นั้นคือวัว เครื่องจะตอบได้แค่หมากับแมวรูปแบบที่ 2 Unsupervised Learning หรือ “มองหาข้อมูลสนับสนุนต่างๆ ในสถานการณ์หนึ่งๆ แล้วพยายามที่จะหาสิ่งที่ดีที่สุดมาช่วยในการตัดสินใจ”สมการ Unsupervised Learningดูจากสมการด้านบนจะเห็นว่า y ได้หายไปแล้ว หมายความว่าเราไม่ต้องบอกว่าข้อมูลนั้นๆ (x) มีคำตอบเป็นอะไร ในที่นี้เราจะโยนข้อมูลเข้าไปในฟังก์ชั่นและให้ Machine นั้นพยายามที่จะเอาข้อมูลไปประมวลผลหาความสัมพันธ์ต่างๆ และนำเสนอผลลัพธ์ที่ได้ออกมาให้เราเห็น ตรงจุดนี้จะไม่เหมือนกับแบบ Supervised นะ ที่ว่าแบบ Supervised จะมีการอนุมาน (inference) ออกมาเป็นคำตอบ แต่แบบ Unsupervised จะไม่มีการตัดสินใจใดๆ การตัดสินใจจะเป็นหน้าที่ของคนยกตัวอย่างเช่น ถ้าเราต้องการจะแบ่งกลุ่มของลูกค้าที่ชอบสินค้าเหมือนๆ กัน Machine ก็จะแค่นำเสนอข้อมูลที่แบ่งกลุ่มออกมาแค่นั้นเอง ส่วนเราจะเอาไปทำอะไรต่อก็เป็นหน้าที่ของเราเองรูปแบบที่ 3 Reinforcement Learning หรือ “ลองผิดลองถูก ถ้าผิดก็เจ็บตัว ถ้าถูกก็ทำต่อไป”สมการ Reinforcement Learningอ้างอิงจากสมการด้านบน ตัวแปร y ในที่นี้ไม่ใช่คำตอบแบบใน Supervised Learning แต่มันคือ action ส่วน x คือข้อมูลที่เข้ามา และ z คือ reward นึกภาพง่ายๆ เลยคือ เวลาที่เราฝึกสุนัข :D ถ้าเราอยากให้สุนัขสวัสดีแบบยกขาหน้าขึ้น ถ้ามันยกขาเราก็ให้ขนมมัน ช่วงแรกๆ มันก็จะทำผิดทำถูก แต่หลังๆ ไปสุนัขของเราก็จะทำได้เองเลย ในที่นี้ การยกขาหน้าขึ้นคือ y คำสั่งที่เราสั่งสุนัขคือ x ส่วนขนมก็คือ z นั่นเองการเรียนรู้แบบนี้ส่วนใหญ่เรานำไปใช้กับหุ่นยนต์หรือเกม ให้หุ่นยนต์หรือเกมค้นหาเส้นทางที่ดีที่สุดเองจากการลองผิดลองถูกการนำเอาไปใช้แก้ปัญหาก่อนที่เราจะนำเอา Learning แต่ละรูปแบบไปใช้ เราต้องเข้าใจปัญหาก่อนว่าปัญหาของเราคืออะไร เราถึงจะเลือกใช้รูปแบบการ Learning ได้ถูก และเหมาะสมครับ เช่น ถ้าเราต้องการที่จะจำแนกอีเมลว่าเป็นสแปมหรือไม่ใช่สแปม ปัญหานี้เราควรจะนำเอา Supervised Learning มาแก้ปัญหา ถ้าเราต้องการจะแบ่ง Segment ของลูกค้า หรือต้องการจะแนะนำสินค้าใหม่ๆ จาก User Preference เราก็ควรที่จะใช้ Unsupervised Learning เข้ามา ส่วน Reinforcement Learning ก็อาจจะเป็นปัญหาแนวที่เราต้องการที่จะ optimize อะไรสักอย่างเพื่อให้ได้ action และนำ action นั้นไปเรียนรู้ต่อแบบอัตโนมัติ ถ้าปัญหาของเรามีการรับ feedback เข้ามาเพื่อการเรียนรู้ เราก็สามารถเอา Reinforcement Learning ไปแก้ปัญหาได้Enjoy Learning ครับ :)
โดย: Kan Ouivirach
| Machine Learning
มาทำความรู้จัก Machine Learning Process กัน
ทำไม Process ถึงสำคัญ?หน้าตา Machine Learning Process (มี 5 ส่วนหลักๆ)เข้าใจปัญหาเตรียมข้อมูล และทำความคุ้นเคยกับข้อมูลนั้นสร้าง Machine Learning โมเดลปรับปรุงโมเดล และผลลัพธ์นำเสนอผลงาน และนำโมเดลไปใช้งานจริงสรุปทำไม Process ถึงสำคัญ?Process นั้นเป็นตัวที่จะช่วยทำให้เราสามารถปฏิบัติตาม ทำงานตามขั้นตอนต่างๆ อย่างเป็นระบบ สามารถจัดการสิ่งต่างๆ ได้อย่างมีระเบียบ รวมไปถึงการเรียนรู้งานนั้นๆ อีกด้วย ซึ่งแน่นอนว่าการทำงานด้าน Machine Learning ก็ต้องมี Process เหมือนกัน มาลองดูกันนะว่าหน้าตามันจะเป็นอย่างไรหน้าตา Machine Learning Processก็จะประมาณนี้Machine Learning Processเรามาทำความเข้าใจกันต่อดีกว่าว่าขั้นตอนแต่ละขั้นเราจะทำอะไรกันบ้าง ก่อนอื่นผมขอแบ่งรูปด้านบนออกมาเป็น 5 ส่วนหลักๆ ได้แก่ทำความเข้าใจปัญหาเตรียมข้อมูล และทำความคุ้นเคยกันข้อมูลนั้นสร้าง Machine Learning โมเดลปรับปรุงโมเดล และผลลัพธ์นำเสนอผลงาน และนำโมเดลไปใช้งานจริงส่วนที่ 1 ทำความเข้าใจปัญหาทำความเข้าใจปัญหาก่อนที่เราจะทำอะไรก็ตามเราต้องเข้าใจปัญหาก่อน ปัญหาคืออะไร? เราจะแก้มันอย่างไร? เราจะแก้มันด้วยวิธีไหน? (Understand)ส่วนที่ 2 เตรียมข้อมูล และทำความคุ้นเคยกับข้อมูลนั้นเตรียมข้อมูล และทำความคุ้นเคยกับข้อมูลนั้นเมื่อเราเข้าใจปัญหาแล้ว เรื่องที่ตามมาก็คือเราต้องมีข้อมูลครับ ถ้าไม่มีข้อมูล Process นี้จบครับ >_< ไม่ต้องทำอะไรต่อเลย LOL ดังนั้นเราต้องมีข้อมูลก่อน ถ้าเรามีข้อมูลอยู่แล้วก็เยี่ยมเลย แต่ถ้าไม่มีเราก็ต้องออกไปเก็บข้อมูลมาก่อนครับ หรือดึงข้อมูลจากระบบที่เรามี (Collect) จากนั้นเราก็ค่อยมาทำความรู้จักกับข้อมูลนั้นๆ (Explore Viz) ไม่ว่าจะเอามาพลอตกราฟ หรือเอามาดูการกระจายตัวของค่าบางค่าในข้อมูล รวมไปถึงอาจจะคำนวณหาค่าทางสถิติพื้นฐานต่างๆ เช่น ค่าเฉลี่ย พอเราเริ่มคุ้นแล้ว เราค่อยมาลองปัดฝุ่น ทำความสะอาดข้อมูลของเรา (Clean) เช่นถ้าข้อมูลช่องไหนมีไม่ครบ เราก็อาจจะหาค่าหนึ่งมาเติมเข้าไป หรือว่าข้อมูลไหนไม่จำเป็นในการวิเคราะห์ก็ตัดทิ้งไปเป็นต้น สุดท้ายเราจะมาปรับข้อมูลของเราให้เราสามารถนำเข้าไปสร้างโมเดลได้ (Transform) ทำไมต้องทำขั้นตอนนี้? เพราะว่า Machine Learning โมเดลนั้นจะรับ input ที่เป็นแบบ fix จำนวน column ครับ และส่วนใหญ่เราต้องแปลงข้อมูลจากข้อความให้กลายเป็นตัวเลขก่อนถึงจะเอาไปสอนโมเดลนั้นได้ส่วนที่ 3 สร้าง Machine Learning โมเดลสร้าง Machine Learning โมเดลในส่วนนี้เราจะเริ่มสร้างโมเดลกันครับ (Model) สำหรับผู้เริ่มต้นผมแนะนำให้เอาโมเดลที่มีอยู่มาทดลองใช้เลยครับ ไม่ว่าจะเป็น Naive Bayes หรือ Support Vector Machine หรือโมเดลอื่นๆ ก็ได้ครับ จังหวะนี้อย่ารีบร้อนไปลงในรายละเอียดหรือสมการของโมเดลนั้นๆ นะครับ อาจจะท้อได้ นอกจากที่เราจะสร้างโมเดลได้แล้ว เราจะต้องทดสอบโมเดลได้ด้วยนะ ว่าถูกจริงหรือเปล่า ดีจริงหรือเปล่า (Validate) ซึ่งตรงนี้จะขอไปกล่าวถึงในบทความต่อๆ ไปนะครับ :)ส่วนที่ 4 ปรับปรุงโมเดล และผลลัพธ์ปรับปรุงโมเดล และผลลัพธ์จากประสบการณ์ของตัวเอง และทุกคนที่ได้พูดคุยกันมา ส่วนนี้เป็นส่วนที่ใช้เวลาเยอะสุดครับ พูดได้ว่าประมาณ 90% เลยทีเดียว สังเกตจากรูปครับ ส่วนที่ 4 นี้จะรวมส่วนที่ 2 และส่วนที่ 3 เข้าไปด้วยกัน และเราจะวนลูปทำเรื่อยๆ ปรับปรุงไปเรื่อยๆ ลองโมเดลใหม่ไปเรื่อยๆ จนกว่าผลที่ได้จะพอใจ หรือจนกว่าจะได้โมเดลที่แม่นยำได้ตามเป้าหมายที่ตั้งไว้ครับ ข้อแนะนำของผมที่จะทำให้ทุกคนทำงานในส่วนนี้ได้อย่างมีความสุขคือ “จงหลงรักข้อมูลนั้นซะ” ครับ เพราะคุณจะใช้เวลากับส่วนนี้ :)ในส่วนนี้ถ้าเราคิดว่าเรามีข้อมูลไม่พอ เราก็ควรกลับไปที่ Collect ใหม่ครับ แล้วค่อยกลับเข้าลูปตามเดิมส่วนที่ 5 (ส่วนสุดท้าย) นำเสนอผลงาน และนำโมเดลไปใช้งานจริงนำเสนอผลงาน และนำโมเดลไปใช้งานจริงสุดท้ายแล้วเราต้องนำผลที่ได้ไปนำเสนอครับ (Communicate Viz) อาจจะไปนำเสนอกับหัวหน้า หรือ stakeholder ก็ได้ ส่วนนี้ไม่ได้ทำเพื่อจะอวดอะไรใครนะครับ แต่มันคือขั้นตอนที่สำคัญขั้นตอนหนึ่งคือ “การรับ Feedback” กลับมา เพื่อเอามาต่อยอดกับผลงานเรา รวมไปถึงการนำโมเดลไปใช้งานจริง (Deploy) แน่นอนครับ มันก็คือ “การรับ Feedback” อีกช่องทางหนึ่ง เมื่อเราลองใช้งานจริงแล้ว เราก็จะมีผลลัพธ์ที่สามารถนำกลับมาพัฒนาต่อยอดได้อีก ตามรูปเลยครับ ลูกศรเราย้อนกลับไปที่ Understand :)สรุปเราได้เรียนรู้หน้าตาของ Machine Learning Process ไปแล้ว ซึ่งการมี Process ที่ดี จะทำให้เราทำงานได้เป็นระบบ และต่อยอดจากองค์ความรู้เดิมได้ง่ายขึ้น จริงๆ แล้ว Process ของแต่ละคน แต่ละทีมก็อาจจะแตกต่างกันไปนะ เริ่มต้นลองยึดสักแบบหนึ่ง แล้วค่อยๆ ปรับเปลี่ยนไปตามความเหมาะสมก็ได้ครับ ;)
โดย: Kan Ouivirach
| Machine Learning
What is Machine Learning?
Machine Learning คืออะไร?ทำไมคนส่วนใหญ่ถึงมองว่าการเรียน Machine Learning ยาก?แนวทางเรียนแบบ Top-Down สนุกกว่า และมีประสิทธิภาพสรุปปิดท้ายMachine Learning คืออะไร?Tom Mitchell (ศาสตราจารย์ภาควิชา Machine Learning ที่ Carnegie Mellon University) กล่าวไว้ว่า Machine Learning คือA computer program is said to learn from experience ‘E’, with respect to some class of tasks ‘T’ and performance measure ‘P’ if its performance at tasks in ‘T’ as measured by ‘P’ improves with experience ‘E’.สรุปได้ประมาณว่า Machine Learning จริงๆ แล้วก็คือ computer program ที่ถูกพัฒนาขึ้นเพื่อเอาไปทำงานใดงานหนึ่งได้เมื่อมีข้อมูลป้อนให้ ถ้า program นั้นทำงานได้ดีขึ้น ก็หมายความว่ามันได้ “เรียนรู้” ที่จะทำงานนั้นๆ แล้วนั่นเองลองนึกถึงเวลาที่เราสอนเด็กก็ได้นะ ถ้าเราอยากสอนให้เด็กรู้จักหมากับแมว เราก็จะเอารูปหมากับแมวให้เด็กคนนั้นดูแล้วบอกไปว่านี่หมานะ นี่แมวนะ ไปเรื่อยๆ จนเด็กคนนั้นเวลาออกไปเจอกับหมาจริงๆ ที่ต่างจากในรูป แล้วสามารถบอกได้ว่านี่คือหมา นั่นก็แปลว่าเด็กคนนี้ได้ “เรียนรู้” แล้วนั่นแหละครับความหมายของ Machine Learning แล้วก็สังเกตว่าผมแอบเน้นคำว่า “เรียนรู้” หรือ “Learning” ไว้ ทำไมเหรอ? เพราะว่าคำๆ นี้เป็นหัวใจของเรื่องนี้เลยทีเดียวครับ ไว้จะพูดถึงในบทความถัดๆ ไปนะทำไมคนส่วนใหญ่ถึงมองว่าการเรียน Machine Learning ยาก?ตามที่ได้พูดคุยและสอบถามความเห็นบวกกับคิดเอาเอง LOL การเรียน Machine Learning ยากเพราะเราโดนสตั้นไปหลายวิเวลาที่เราเจอสมการ Math กับทฤษฎีต่างๆ ที่ถาโถมเข้ามาไม่ได้เป็นวิชาปกติในหลักสูตรการเรียนการสอนอาศัยความรู้หลายแขนงมากจนไม่รู้ว่าจะเริ่มตรงไหนดีไม่มีเวลาแค่ 4 ข้อสุดฮิตที่ว่ามาเราก็ไม่อยากจะเรียนแล้ว อ่านสมการไม่ออก ต้องไปหัดอ่านสมการใหม่ เราคงต้องกลับไปเรียนเลขใหม่ด้วย ต้องเรียนทฤษฎีเรื่องนู้นเรื่องนี้ก่อนถึงจะเข้าใจใช่ไหม คำถามพวกนี้น่าจะวนเวียนอยู่ในหัวของหลายๆ คน ซึ่งผมมองว่าไม่ผิดอะไรครับ มันเป็นเพราะว่าระบบการศึกษาฝึกให้เราเรียนจากพื้นฐานมาตลอดตั้งแต่เด็กจนโต ซึ่งการเรียนแบบนี้เรียกว่าแบบ Bottom-Up ครับการเรียนรู้แบบนี้มีข้อดีคือเรารู้พื้นฐานต่างๆ เราเรียน เลข ฟิสิกส์ เคมี ชีวะ วงจรดิจิตอล ฯลฯ เราจะมีพื้นฐานแน่น! แต่.. ข้อเสียคือเราไม่รู้ว่าเราเรียนไปทำไม เราจะเอาสิ่งที่เรียนไปปะติดปะต่อกับการเอาไปใช้ รวมไปถึงผลลัพธ์ที่เราได้จากการเรียนได้ยากมากถึงยากที่สุด“ไม่สนุกเลย” ใช่ครับ ไม่สนุกเลย คำๆ นี้เป็นกำแพงขนาดมหึมา ปิดกั้นเราจากทุกสิ่งในโลก สกัดกั้นเราไม่ให้ไปถึงจุดหมายที่ตั้งไว้ และไม่ว่าเราจะฝืนต่อไปท่าไหน กำแพงนั้นก็จะยิ่งแกร่งครับ เพียงแค่คำสั้นๆ คำนี้ “ไม่สนุก”แนวทางเรียนแบบ Top-Down สนุกกว่าและมีประสิทธิภาพแนวทางแบบ Top-Down นี้จะทำให้ เราสามารถปะติดปะต่อกับการนำไปใช้งานจริง และเห็นผลลัพธ์ได้แทบจะทันที ซึ่งจริงๆ แล้วในชีวิตประจำวันคนเราก็ใช้การเรียนรู้แบบนี้อยู่นะ ยกตัวอย่างเช่น การขับรถ เป็นต้น คือเวลาเราเริ่มเรียนขับรถ เราไม่ได้ไปเรียนว่าเครื่องยนต์ทำงานอย่างไรก่อนใช่เปล่า เราเรียนแค่ว่าถ้าเราเหยียบคันเร่ง รถมันก็เคลื่อนไปข้างหน้าแล้ว~ ลองย้อนกลับไปตอนที่เราหัดใหม่ๆ แน่นอนว่าเมื่อเราเหยียบคันเร่ง แล้วรถมันเคลื่อนไปข้างหน้า เรารู้สึกอย่างไร? “สนุก”ดังนั้นแทนที่เราจะเรียนรู้ Machine Learning ในแบบ Top-Down เราจะเรียนรู้ Applied Machine Learning แทน คือเอาไปใช้งานเลย ใช้กับปัญหาง่ายๆ ก่อน แล้วเราค่อยต่อยอดไปจากตรงนั้นแทน ขั้นตอนคร่าวๆ ที่อยากให้ไปลองดูกันก็ตามนี้เรียนรู้กระบวนการของ Applied Machine Learning และเอาไปลองใช้กับปัญหาง่ายๆฝึก ฝึก ฝึก และฝึก และฝึกกกกก กับปัญหาใหม่ๆ กับข้อมูลใหม่ๆลงรายละเอียดเพิ่ม เรียนรู้ทฤษฎีใหม่ๆ Algorithm ใหม่ๆสำหรับขั้นตอนที่ 1 เราสามารถหา tool มาลองเล่นเองได้ง่ายๆ เช่น Weka หรือ RapidMiner ถ้าเราไม่ถนัดเขียนโค้ด หรือถ้าอยากเขียนโค้ดเลยก็ลอง scikit-learn ครับ เหมาะสำหรับการเรียนรู้มาก ทั้งมือใหม่และทั้งคนที่มีประสบการณ์แล้วอ้อ.. อย่างหนึ่งที่ช่วยให้เราเรียนได้มีประสิทธิภาพมากขึ้นก็คือเขียนสิ่งที่เราได้เรียนไปออกมาครับ การเขียนเป็นการเรียบเรียงความคิดของเราได้ดีมากกกกกก แนะนำ!สรุปปิดท้ายสำหรับใครก็ตามที่อยากเรียนรู้เรื่อง Machine Learning อย่าเพิ่งไปเริ่มอ่านสมการหรือทฤษฎี อย่าเพิ่งไปเริ่มเขียนโค้ด Algorithm จากศูนย์ ขอให้ลองแบบ Top-Down ก่อน เป็นแนวทางที่ “สนุก” กว่า และผมมองว่าเป็นแนวทางที่เราใช้ในชีวิตประจำวันอยู่แล้ว เวลาทำแล้วเห็นผลลัพธ์ พอเห็นผลลัพธ์เราก็เห็นความคืบหน้า พอเห็นความคืบหน้าสุดท้ายเราก็จะสนุกไปกับมัน

พบบทสัมภาษณ์ได้ที่นี่เร็ว ๆ นี้

พบDigital Skill บนสื่อ ได้ที่นี่เร็ว ๆ นี้