บทความ
ไม่ว่าจะ ข่าวสาร บทสัมภาษณ์ และ Digital Skill บนสื่อ
มีให้คุณได้อ่านบทความดี ๆ มากมายแล้วที่นี่
โดย: Kan Ouivirach
| Machine Learning
การจัดการ Missing Data
ทำไมเราถึงต้องมาดูการจัดการ Missing Data (ข้อมูลที่หายไป) กันด้วยนะ? เกี่ยวอะไรกับ Machine Learning เหรอ?เรื่องนี้เกี่ยวข้องโดยตรงกับ Machine Learning เลยครับ โดยเฉพาะตอนที่เรากำลังที่จะสร้างโมเดล Machine Learning เพราะอะไรถึงเกี่ยวล่ะ? มาดูข้อมูลง่ายๆ กันครับ เช่น ถ้าเราต้องการที่จะสร้างโมเดลทำนายความสูงของคนจากอายุ เราก็อาจจะมีข้อมูลประมาณนี้แล้วเราก็อาจจะสร้างโมเดล Linear Regression กับข้อมูลชุดนี้ แล้วเอาโมเดลไปทำนายว่าอายุ 23 น่าจะมีความสูงเท่าไหร่ ก็ดูไม่มีปัญหาอะไรในโลกความเป็นจริงข้อมูลเราอาจจะมีไม่ครบ หรือเราทำแบบสอบถามไปแล้วเค้าไม่ตอบ หน้าตาข้อมูลก็จะมีประมาณนี้ข้อมูลความสูงที่อายุ 21 ของเราหายไป ซึ่งตรงนี้เราจะไม่สามารถสร้างโมเดลได้ครับ เนื่องจากสมการทางคณิตศาสตร์ของ Machine Learning โมเดล (รวมไปถึงสมการคณิตศาสตร์อื่นๆ) จะไม่มีการเอาค่าว่างๆ ไปคำนวณร่วมกับค่าเลขอื่นๆ ลองสมการง่ายๆ ดูก็ได้ครับ อ่ะ ไหนลองหาผลรวมของความสูงหน่อย? เราจะ.. 160 + ? + 175.5 + 173 เอ่อ.. คำนวณไม่ได้ นั่นแหละครับ Machine Learning ก็เหมือนกันวิธีแก้ Missing Data นี่มีหลายวิธี วิธีที่ง่ายที่สุดแบบแทบไม่ต้องใช้ความคิดเลยคือลบแถวที่มี Missing Dta นั้นทิ้งไปเลย! :joy: วิธีนี้ก็อาจจะทำให้ผลของโมเดลดีขึ้นก็ได้นะ อย่ามองข้ามๆแต่ว่าบทความนี้อยากจะพูดถึงวิธี Mean/Median/Mode Imputation Imputation ครับ ชื่อนี่อาจจะดูหรูหน่อย ถ้าเราเรียกแบบบ้านๆ ก็คือเราแทนค่า Missing Data ด้วยค่า Mean/Median/Mode นั่นเอง~ถ้าเราแทนค่าด้วย Mean เราจะได้ตามนี้ (160 + 175.5 + 173) / 3ถ้าเราแทนค่าด้วย Mode เราจะได้ตามนี้ (ในที่นี้แค่เลือกสักค่ามาแทนครับ เนื่องจากค่า 160, 175.5 และ 173 มีจำนวนเท่ากัน)ถ้าเราแทนค่าด้วย Median เราก็จะได้ตามนี้ (เรียงข้อมูลก่อน 160, 173, 175.5 เลือกค่ากลางคือ 173)เท่านี้เราจะได้ข้อมูลครบแล้วครับ พร้อมที่จะเอาไปสร้างโมเดลต่อไปแล้ววิธีไหนให้ผลดีที่สุด? จะตอบได้ก็ต่อเมื่อเราได้ลองสร้างโมเดลจากข้อมูลแต่ละแบบ แล้ววัดผลว่าแบบให้ผลดีที่สุดครับข้อควรระวัง ไม่ใช่ว่าถ้า Median Imputation ให้ผลดีที่สุด เราจะสามารถนำเอาวิธี Median Imputation ไปใช้กับข้อมูลอื่นได้เลยนะครับ ข้อมูลอื่นก็เป็นส่วนของข้อมูลอื่น เรายังคงต้องทดลองกับหลายๆ วิธีอยู่ดี ;)
โดย: Laris
| IoT
มารู้จัก MQTT Protocol กันดีกว่า (ตอนที่ 2)
หลังจากบทความที่ผ่านมา เราพูดถึง MQTT Basics ซึ่งผู้เขียนเองได้พูดถึงการ Publish และ การ Subscribe เบื้องต้นClient, Broker, and Connection EstablishmentMQTT Publish, Subscribe, and Unsubscribeและ MQTT Topicsบทความนี้เราจะพูดก็คือ QoS หรือ Quality of Service ค่ะQoS คืออะไร? QoS คือ ข้อตกลงระหว่างผู้ส่ง และ ผู้รับ Message ซึ่งกำหนดไว้เพื่อเป็นการการันตีว่า Message นั้น สามารถถูกส่งไปถึงผู้รับแน่นอน ซึ่งใน MQTT จะมีอยู่ 3 ระดับค่ะAt most once (0)At least once (1)Exactly once (2)ในการกำหนดค่า QoS ใน MQTT เราจะพิจารณาการรับส่ง Message เป็น 2 ส่วนนะคะ คือส่วนที่ 1 : Message ที่ถูกส่งจาก Publisher ไป Brokerส่วนที่ 2 : Message ที่ถูกส่งจาก Broker ไป Subscriberสาเหตุที่เราต้องพิจารณาเป็น 2 ส่วน เพราะว่า ถึงแม้ ว่าจะเป็นการส่ง Message ที่มี Content เดียวกัน แต่ว่าผู้ส่งและผู้รับในส่วนที่ 1 และ ส่วนที่ 2 แตกต่างกันนะคะเวลาที่ Publisher ต้องการส่ง Message ให้กับ Broker ตัว Publisher จะเป็นฝ่ายกำหนดค่า QoS ให้กับ Message นั้นๆ แต่ตรงกันข้ามเวลา Broker จะส่งต่อ Message ให้กับ Subscriber เนี่ย จะใช้ค่า QoS ที่ถูกกำหนดโดย Subscriber ค่ะแล้วถ้าเกิดค่า QoS ระหว่างส่วนที่ 1 และ ส่วนที่ 2 ต่างกันแล้วเราจะต้องใช้ค่าไหน? ถ้าหากค่า QoS จากส่วนที่ 2 มีค่าต่ำกว่าค่า QoS ในส่วนที่ 1 ตัว Broker จะใช้ค่า QoS ที่ต่ำกว่า ซึ่งก็คือค่า QoS จากส่วนที่ 2 ค่ะจะเห็นว่า QoS นั้นมีความสำคัญกับ MQTT ไม่น้อยเลย นั่นเพราะว่า QoS ถือว่าเป็น Key Feature นึงของ MQTT Protocol ค่ะ QoS ให้อิสระกับ Client (Publisher/Subscriber) ในการกำหนดค่า เพื่อให้รองรับกับประสิทธิภาพของ Network และ ApplicationQoS ทำให้การรับส่ง Message เป็นไปอย่างราบรื่น ถึงแม้จะเจอข้อจำกัดทาง Network (Unreliable Network ) เพราะว่า MQTT สามารถจัดการเรื่อง Message Retransmission และ มีการการันตีว่า Message จะได้รับแน่นอนถึงตรงนี้เราลองมาดูกันค่ะว่าแต่ละเลเวลของ QoS มีความหมาย และ ทำงานอย่างไรในระบบของ MQTT Protocolระดับของ QoSQoS 0 — at most onceระดับ QoS ที่น้อยที่สุดคือ ศูนย์ (0) ค่ะ ซึ่งค่านี้จะไม่มีการการันตีการได้รับ Message เลย ( Best-Effort Delivery ) ในระดับ QoS นี้ Message จะไม่ถูกจัดเก็บเพื่อทำการ Retransmission ค่ะQoS 0 จะมักจะถูกเรียกว่า ‘Fire and Forget’ และจะมีเลเวลการการันตีการได้รับ Message ตาม TCP Protocol ใน Layer ด้านล่างค่ะ (เพราะ MQTT Protocol อยู่ใน Application Layer ตาม TCP/IP Network Model ค่ะ)QoS 0 จะมักจะถูกเรียกว่า ‘Fire and Forget’ และจะมีเลเวลการการันตีการได้รับ Message ตาม TCP Protocol ใน Layer ด้านล่างค่ะ (เพราะ MQTT Protocol อยู่ใน Application Layer ตาม TCP/IP Network Model ค่ะ)Qos 0 — at most onceQoS 1 — at least onceQoS 1 นั้น จะการันตีว่าผู้รับจะได้รับ Message อย่างน้อย 1 ครั้ง ซึ่งผู้ส่งจะจัดเก็บ Message นี้ไว้จนกระทั่ง ได้รับ PUBACK Packet จากผู้รับซึ่งถือเป็นการตอบรับว่าได้รับ Message นั้นๆแล้ว ซึ่งในเลเวลนี้เป็นไปได้ว่า จะมีการส่ง หรือ รับ Message ได้มากกว่า 1 ครั้งQos 1 — at least onceใน PUBACK Packet จะมีรายละเอียดเกี่ยวกับ Packet ID ค่ะ ซึ่งตัวผู้ส่งเองจะใช้ไอดีนี้ในการตรวจสอบว่าผู้รับได้รับ Message หรือยัง ถ้าหากว่า ผู้ส่ง ไม่ได้รับ PUBACK Packet ในระยะเวลาที่เหมาะสม ผู้ส่งจะเริ่มทำการส่ง Message อีกครั้งค่ะ (ผู้ส่งใน MQTT เป็นได้ทั้ง Publisher และ Broker นะคะ เพราะเราแบ่งการส่ง Message เป็น 2 ส่วน สามารถย้อนไปอ่านข้างบนได้ค่ะ)ในกรณีที่ ผู้รับ ได้รับ Message ที่มี QoS 1 และถ้าผู้รับคือ Broker หลังจากได้รับ Message แล้ว Broker จะส่งต่อ Message ให้ Subscriber ทุกตัว ที่ได้ Subscribe ไว้ และทำการส่ง PUBACK Packet กลับไปยัง Publisher ค่ะ ถ้าหากว่า Message ที่ได้มีการตอบรับด้วย PUBACK Packet แล้วแต่มีการส่งซ้ำจากผู้ส่ง Message นั้นจะถูกเซทค่า DUP Flag ซึ่งเป็นค่านี้จะไม่ถูกนำไปใช้โดยผู้รับ (Broker/Subscriber) นั่นหมายความว่าไม่ว่า Message นั้น จะถูกตอบรับ ด้วย PUBACK Packet หรือไม่ เมื่อไหร่ที่ผู้รับได้รับ Message (ที่มี หรือ ไม่มี DUP Flag) ผู้รับก็จะทำการส่งกลับ PUBACK Packet ไปยังผู้ส่งทุกครั้งQoS 2 — exactly onceQoS 2 ถือว่าเป็นค่าสูงที่สุด ในระดับ QoS ใน MQTT ซึ่งการันตีว่าแต่ละ Message จะถูกส่ง และได้รับเพียงครั้งเดียวเท่านั้น ซึ่งถึงแม้ว่าการใช้ QoS 2 จะเป็นวิธีที่ให้ความมั่นใจได้ว่าผู้รับจะได้รับ Message และ ไม่มีการส่งซ้ำ(หากมีการได้รับ Message แล้ว) แต่ก็เป็นระดับ QoS ที่มีการทำงานช้าตามไปด้วย เพราะจำเป็นต้องใช้การส่งและรับ Request/Response อย่างน้อยถึง 2 ครั้ง (ซึ่งเท่ากับการทำ Handsharke 4 ครั้ง) ระหว่าง ผู้รับ และ ผู้ส่ง ใน QoS 2 ก็จะใช้ Packet ID ในการจัดการการรับส่ง Message เช่นเดียวกับใน QoS 1Qos 2 — exactly onceหลังจากที่ผู้รับ ได้รับ Message แล้ว ตัวผู้รับจะทำตอบกลับผู้ส่งด้วย PUBREC Packet ถ้าหากผู้ส่งไม่ได้รับ PUBREC Packet ผู้ส่งจะส่ง Message เดิมอีกครั้งด้วย DUP Flag จนกว่าจะได้รับ PUBREC Packetและทันทีที่ผู้รับได้รับ PUBREC Packet แล้ว ผู้ส่งจะทำการจัดเก็บ PUBREC Packet ไว้ และทำการส่ง PUBREL Packet กลับไปให้ผู้รับ และผู้รับก็จะทำการรีเซทState ทั้งหมด และจัดส่ง PUBCOMP Packet ไปให้ผู้ส่ง( ซึ่งผู้ส่งก็จะทำการรีเซท State เช่นกัน เมื่อได้รับ PUBCOMP Packet จากผู้รับ) ในระหว่างการรับส่ง Message นี้ ก่อนที่จะมีการตอบรับจากผู้ส่ง ด้วย PUBCOMP Packet ตัวผู้รับจะทำการจดจำ Packet ID ไว้ ซึ่งถือว่าเป็นกระบวนการที่สำคัญมากในการหลีกเลี่ยงการส่ง Message ซ้ำอีกครั้งหลังจากที่ผู้รับ ได้รับ PUBCOMP Packet แล้ว Packet ID นี้ก็จะถูกนำไปวนใช้ต่อไปค่ะ ซึ่งตามหลักการแล้วหากมีการนำตัวเลขนี้ไปวนใช้อีก Packet ID จะมีค่าได้ไม่เกิน 65535 ค่ะ แต่หากโชคไม่ดี เกิด Message หายระหว่างทาง ไม่มีการตอบรับจากผู้รับในช่วงเวลาที่กำหนด ผู้ส่งก็จะทำการจัดส่ง Message อีกครั้งค่ะถึงตรงนี้ อาจจะมีข้อสงสัยว่า…แล้วจะเลือกใช้ QoS ยังไงดี?การเลือกใช้ระดับของ QoSถ้าหากว่าเรามี Network ที่ค่อนข้าง Stable เช่น มีการใช้สายแลนเชื่อมต่อระหว่าง Publisher/Subscriber (มั่นใจว่าการเชื่อมต่อไม่หลุดง่ายๆแน่นอน) หรือ เรายอมรับได้กับ Message ที่หล่นหายไปบ้างระหว่างทาง ซึ่ง Message นั้นอาจจะไม่สำคัญมากเท่าไหร่ หรือ เราส่งถี่มากพอที่การสูญหายของ Message จะไม่มีผลกระทบมากมาย หรือ หากเราไม่ต้องการให้ Message ทำการ Queuing (Message Queuing มีผลเมื่อเลือกใช้ QoS 1 หรือ QoS 2 และมีการใช้ Persistent Session จะกลับมาอธิบาย Persistent Session ในบทความถัดไปนะคะ ) เลือกใช้ QoS 0 เลยค่ะแต่ถ้าหากว่าระบบของเรามีความจำเป็นที่ต้องได้รับทุก Message ที่ถูก Publish (ห้ามพลาดเลย) มีสองทางเลือกค่ะ คือ QoS 1 หรือ QoS2 หลังจากนั้นมาลองพิจารณาค่ะว่าหากเกิดการรับส่งซ้ำของ Message แล้วเนี้ย ระบบของเรารับได้มั้ย จะมีปัญหากับ Application ที่เราใช้รึป่าว หากไม่ติดปัญหาเรื่องการส่งซ้ำของ Message ได้ QoS 1 เป็นตัวเลือกที่เหมาะสมที่สุดค่ะ เพราะเมื่อเทียบกับ QoS 2 แล้ว QoS 1 ทำการรับส่งได้เร็วกว่ามากคะบทความถัดไป จะพูดคุยเพิ่มเติมเรื่อง Persistent Session ค่ะ ซึ่งสำคัญมาก หากอุปกรณ์ IoT ของเราเกิดอยู่ๆ Offline ไป แล้ว MQTT จะมีการจัดการเรื่องนี้ให้เรายังไง คอยติดตามอ่านกันนะคะ สวัสดีค่ะ
โดย: Pii
| Blockchain
อธิบายบล็อคเชนให้เด็กฟัง
ปัจจุบันเริ่มมีผู้คนให้ความสนใจบล็อคเชนในแง่ของการนำเอาไปประยุกต์ใช้จริงกับธุรกิจต่างๆของตน ผู้คนเริ่มตระหนักถึงตัวตนและความเปลี่ยนแปลงที่จะเกิดขึ้นจากการมีอยู่ของบล็อคเชนมากขึ้นเรื่อยๆ จริงๆแล้วบล็อคเชนทำงานอย่างไร? ซื้อขายได้อย่างไร?กรณีทั่วไปไม่ใช้บล็อคเชนน้อง ก. มีการจดบันทึกรายรับรายจ่ายของตนเองลงในสมุด ก. น้อง ก. จึงเป็นผู้มีสิทธิ์ในบันทึกนั้นแต่เพียงผู้เดียว คือคนอื่นดูไม่ได้(ถ้าไม่ได้รับอนุญาต) สามารถแก้ไขข้อมูลบันทึกได้หากต้องการ เมื่อคุณพ่อคุณแม่ขอดูบันทึกดังกล่าว คุณพ่อคุณแม่จึงต้อง “เชื่อ” ข้อมูลของน้อง ก. โดยปริยาย แม้ว่าจะมีการเปลี่ยนแปลงข้อมูล ณ เวลาไหนก็ตาม ไม่มีใครสามารถรู้ได้นอกจากน้อง ก.กรณีบล็อคเชน(จำลอง)คราวนี้คุณพ่อคุณแม่บังคับให้ 3 พี่น้อง ก. ข. ค. จดบันทึกรายรับรายจ่ายของทั้ง 3 คน ลงไปในบันทึก 3 เล่ม ก. ข. ค. ตามลำดับ กล่าวคือน้อง ก. จดรายรับรายจ่ายทั้งตัวเองและพี่ทั้ง 2 ลงสมุด ก. พี่ ข. จดเหมือน น้อง ก. ลงสมุด ข. และพี่ ค. จดเหมือนน้องๆลงสมุด ค. โดยมีเงื่อนไขว่าทุกบรรทัดต้องจดเหมือนกัน เมื่อใครต้องการจะเขียนข้อมูลเพิ่ม ทุกคนที่เหลือต้องเขียนให้เหมือนกันสมมุติว่าเด็กๆปฏิบัติตามเงื่อนไขในการจดบันทึก สิ่งที่เกิดขึ้นคือคุณพ่อคุณแม่สามารถ “เชื่อ” ความถูกต้องของระบบการจดบันทึกนี้ได้ คราวนี้หากว่าน้อง ก. แอบเปลี่ยนข้อมูลการใช้เงินของตัวเองในสมุด ก. ข้อมูลนั้นก็จะไม่ตรงกันกับข้อมูลใน สมุด ข. และ ค. คุณพ่อคุณแม่ก็จะทราบทันทีว่ามีการปลอมแปลงข้อมูลเกิดขึ้นจากการเทียบดูสมุดแต่ละเล่มบล็อคเชนคือ การจดบันทึกซ้ำซ้อนลงไปในฐานข้อมูลหลายตัว(ปัจจุบัน บิทคอยน์และอีเธอเรียม แต่ละเหรียญมีฐานข้อมูลประมาณ 10,000 ตัว) ซึ่งมีอัลกอริทึ่มทางคณิตศาสตร์ในการรักษาเงื่อนไขในการบันทึกข้อมูลว่าทุก node ต้องมีข้อมูลชุดเดียวกันเป๊ะๆ ดังนั้น จึงไม่สามารถปลอมแปลง คัดลอก(ก๊อปปี้) ข้อมูลดังกล่าวไปแปะเพิ่มให้มากขึ้นได้แท้จริงแล้ว บิทคอยน์ ก็คือข้อมูลที่ถูกบันทึกอยู่ในสมุด ก. ข. ค. นั่นเอง เช่นว่าน้อง ก. มี 10 บิทคอยน์ พี่ ข. มี 20 บิทคอยน์ และพี่ ค. มี 30 บิทคอยน์ โดยเมื่อ ลุง ง. อยากมีบิทคอยน์บ้าง ก็ติดต่อขอซื้อบิทคอยน์จาก ผู้ที่ถืออยู่(พี่น้อง ก. ข. ค.) โดยน้อง ก. อาจจะขายให้ ลุง ง. ที่เหรียญละ 100 บาท เมื่อตกลงกันได้แล้ว น้อง ก. ก็ต้องทำการบันทึกเพิ่มลงไปว่า ตนเองเหลือ 8 เหรียญ ลุง ง. มี 2 เหรียญ เช่นเดียวกันกับ พี่ ข. และ พี่ ค. ลงไปในสมุดทั้ง 3 เล่มนั่นเองสรุปคือ บล็อคเชนเป็นฐานข้อมูลซ้ำซ้อน ที่มีผู้ถือครองอยู่ทั่วโลก ทำให้ไม่สามารถเปลี่ยนข้อมูลที่จดบันทึกไปแล้วได้ โอกาสถัดไปจะพูดถึงการรักษาความปลอดภัยกรณี 3 พี่น้อง เกิดโกง ลุง ง. ระบบจะป้องกันการโกงอย่างไรครับ
โดย: Kan Ouivirach
| Machine Learning
วัดประสิทธิภาพของโมเดล (Two-Class Prediction)
การที่เราสร้างโมเดลๆ หนึ่งขึ้นมาทำนายผลนั้น การวัดประสิทธิภาพของโมเดลเป็นสิ่งที่สำคัญ และจำเป็นต้องทำเพื่อเราจะได้รู้ว่าโมเดลนั้นๆ ดีแค่ไหนก่อนที่เราจะทำไปใช้งานจริง บทความนี้เลยอยากจะเขียนถึงการวัดผลโดยใช้ปัญหาที่เรียกว่า Two-Class Prediction หรือ Binary Classification ซึ่งเป็นการวัดประสิทธิภาพที่เรานิยมใช้กัน ตัวอย่างของปัญหานี้ก็อย่างเช่น การตรวจจับสแปมหรือไม่ ถ้าเป็นก็ตอบ Yes ถ้าไม่เป็นก็ตอบ No เป็นต้นโดยเราจะบอกว่าผลลัพธ์ที่ได้ว่าเป็นคลาส Positive หรือ Negative มีได้ 4 แบบ คือTrue Positive (TP) หมายความว่า เราได้ผลลัพธ์จากการทำนายคือ p และค่าจริงๆ ก็คือ p ด้วยFalse Positive (FP) หมายความว่า เราได้ผลลัพธ์จากการทำนายคือ p แต่ว่าค่าจริงๆ แล้วคือ nTrue Negative (TN) หมายความว่า เราได้ผลลัพธ์จากการทำนายคือ n และค่าจริงๆ ก็คือ n ด้วยFalse Negative (FN) หมายความว่า เราได้ผลลัพธ์จากการทำนายคือ n แต่ว่าค่าจริงๆ แล้วคือ pค่า TN จะกลับกันกับ TP และ FN จะกลับกันกับ FP ตามลำดับอ่านแล้วอาจจะสับสน อย่าเพิ่งปิดบทความนี้ครับ >_< ใจเย็นๆ ขอผมยกตัวอย่างมาอธิบายเพิ่มเติมก่อนนะครับ จะได้เห็นภาพมากขึ้น สมมุติว่าเราต้องการจะทำนายว่า พฤติกรรมของคนๆ นี้ผิดปกติหรือไม่? หรืออีกนัยหนึ่งคือ เราต้องการที่จะตรวจจับพฤติกรรมที่ผิดปกติของคนๆ หนึ่งในที่นี้จะได้ว่า พฤติกรรมที่ผิดปกติคือคลาส Positive ส่วนพฤติกรรมปกติคือคลาส Negative จะได้ว่าTP คือ ระบบเราตรวจจับได้ว่าคนๆ นี้ผิดปกติ (p) และ คนๆ นี้ได้มีพฤติกรรมผิดปกติจริงๆ (p)FP คือ ระบบเราตรวจจับได้ว่าคนๆ นี้ผิดปกติ (p) แต่ว่า จริงๆ แล้ว เค้าไม่ได้ทำอะไรผิดเลย (n)TN คือ ระบบเราไม่ได้ตรวจจับอะไรเลย (n) และ คนๆ นี้ก็ไม่ได้ทำผิด (n)FN คือ ระบบเราไม่ได้ตรวจจับอะไรเลย (n) แต่ว่า คนๆ นี้ จริงๆ แล้วเค้ามีพฤติกรรมที่ผิดปกติ! (p)พอนึกออกรึเปล่าครับ? เอาอีกสักตัวอย่างเนอะ อย่างถ้าเราเขียนโมเดลระบบตรวจจับสแปมเมล ถ้าเจอสแปมเมลให้ลบทิ้งเลย (ระบบ Aggressive หน่อยๆ)ในที่นี้จะได้ว่า เมลที่เป็นสแปมคือคลาส Positive ส่วนเมลปกติคือคลาส NegativeTP คือ ระบบทำนายว่าเมลนี้เป็นสแปม (p) และ มันก็เป็นสแปมจริงๆ (p)FP คือ ระบบทำนายว่าเมลนี้เป็นสแปม (p) แต่ว่า จริงๆ แล้วเมลนี้เป็นเมลปกติ เช่น ข่าวสารทั่วไป เมลเกี่ยวกับงานต่างๆ (n)TN คือ ระบบทำนายว่าเมลนี้เป็นเมลปกติ (n) และ เมลนี้ก็ปกติจริงๆ (n)FN คือ ระบบทำนายว่าเมลนี้เป็นเมลปกติ (n) แต่ว่า จริงๆ แล้วมันเป็นสแปม! (p)ค่าที่ได้จาก 2 ตัวอย่างข้างต้นนี้ สามารถช่วยให้เราวิเคราะห์และนำไปพัฒนาโมเดลให้ดียิ่งขึ้นได้อีก จากตัวอย่างแรกจะเห็นได้ว่าค่า FN นั้นสำคัญมาก ถ้าค่า FN เราสูงไปแสดงว่า เราตรวจจับคนร้ายไม่ได้เลย และจากตัวอย่างที่สองจะเห็นได้ว่าค่า FP นั้นสำคัญ เนื่องจากเป็นระบบแนวโหดที่เวลาเจอสแปมแล้วจะลบทิ้งเลย ดังนั้นถ้าค่า FP สูง ระบบเราก็อาจจะลบเมลสำคัญๆ ของเราทิ้งไปนั่นเองที่เขียนมาด้านบนอาจจะจำยากหน่อย ว่าแบบไหนจะเรียก False Positive หรือแบบไหนเราจะเรียกว่า False Negative ผมวิธีจำง่ายๆ มาเสนอครับ ตามนี้เลยให้ดูก่อนว่าเป็น Positive หรือ Negative โดย Positive คือ โมเดลของเราทำนายว่ามันเป็น Positive (เป็นคนร้ายหรือเป็นสแปม)แล้วเราค่อยดูว่า True หรือ False ครับ ถ้า True คือ ที่ โมเดลของเราทำนายไปนั้น ถูกต้องแล้ว ถ้า False คือ โมเดลเราทำนายผิดเวลาเราตรวจหาอะไรก็ให้สิ่งนั้นเป็น Positive เช่น จะตรวจหาสแปม เราก็ให้สแปมเป็น Positive แล้วถ้าระบบเราทำนายว่าเป็นสแปมจริงๆ ก็แปลว่าเราได้ค่า True Positive ถ้าระบบเราทำนายว่าไม่ใช่สแปม แต่จริงๆ เป็นสแปม ก็แปลว่าเราได้ False Positive นั่นเองหวังว่าจะได้ประโยชน์กันนะครับ
โดย: Laris
| IoT
รู้จัก MQTT Protocol (ตอนที่ 1)
ในการพัฒนาระบบทางด้าน IoT นั้นมีหลายโพรโตคอล (Protocol) ให้เราเลือกใช้ ซึ่งทางผู้เขียนเห็นว่า MQTT เป็นตัวเลือกที่ดีในการเริ่มต้นกับงาน หรือการเขียนโปรแกรมทางด้าน IoT ค่ะIntroducing MQTTMQTT เป็น Protocol ที่แรกเริ่มได้ถูกออกแบบเพื่อนำไปใช้ในการติดต่อระหว่างท่อน้ำมันและดาวเทียม ดังนั้น Protocol ตัวนี้จะต้องใช้พลังงาน และ Bandwidth น้อยที่สุด MQTT ถูกใช้โดย IBM เพียงผู้เดียว มาเกือบทศวรรษ หลังจากถูกคิดค้นออกแบบ หลังจากนั้น IBM ก็ได้ปล่อยตัว MQTT 3.1 ให้คนภายนอกได้ใช้กันปี 2014 MQTT 3.1.1 ได้รับการรับรองมาตรฐานโดย OASIS และ ISO และจากเดิมที่เคยเป็นเพียง acronym (MQTT — MQ Telemetry Transport) MQTTได้กลายมาเป็นชื่อของ Protocol ซึ่งถูกใช้อย่างแพร่หลายในโลกของ IoT และ M2M(Machine to Machine) เพราะมีข้อดีที่ว่ามีขนาดเล็ก สามารถส่งข้อมูลได้เกือบ Real-time โดยใช้ Bandwidth ต่ำ และมี Delivery Guarantee ถึงแม้จะใช้กับ Network ที่ไม่ค่อยสถียร และ ที่สำคัญ ไม่ยุ่งยากสำหรับ DevelopersPublish & Subscribe Basicspublish / subscribe หรือ ที่รู้จักกันว่า pub / sub ซึ่งเป็นอีก Architecture นึง ที่แตกต่างไปจาก Client-Server ที่เราๆรู้จักและใช้กันมานาน เพราะ Publisher หรือ Client ที่ใช้ส่งข้อความ และ Subscriber หรือ Client ที่ใช้รับข้อความ จะไม่คุยกันโดยตรง เหมือนเช่น Client และ Server แต่จะพูดคุยผ่าน Broker ซึ่ง Broker เองก็มีหน้าที่สำคัญในการ Filter ข้อความที่ได้รับจาก Publisher เพื่อจัดส่งต่อไปยัง Subscriber ที่สนใจจะรับข้อความนั้นได้อย่างถูกต้องการแยก Publisher และ Subscriber ไม่ให้คุยกันโดยตรง มีข้อดีหลายอย่าง Publisher และ Subscriber ไม่จำเป็นต้องรู้จักกัน ไม่จำเป็นต้องรู้ว่าใคร IP หรือ Port อะไร และไม่จำเป็นต้อง Online พร้อมกัน เพราะมี Broker เป็นตัวควบคุมดูแลอยู่ และทำให้การ Scale up ง่ายมากขึ้นBroker จะมีวิธีการ Filter ข้อความ หลากหลายแบบ เช่นSubject-Based Filtering ที่จะ Filter เอาแต่ข้อความที่มี Subject หรือ Topic เป็นส่วนหนึ่งข้อความนั้นๆ ซึ่งโดยทั่วไปตัว Topic จะอยู่ในรูปแบบของ String ที่มีโครงสร้างแบบขั้นเลเวล (Hierachical Structure)Content-Based Filtering ที่จะ Filter เอาแต่ข้อความที่มีContent ตามที่ได้ Subscribe ไว้ ซึ่งจะมีข้อเสียตรงที่เราจำเป็นต้องรู้ Content ของข้อความล่วงหน้า และ เป็นการยากที่จะ Encrypt ข้อความType-Based Filtering เมื่อ Object-Oriented Language ถูกนำมาใช้ ข้อความก็จะถูก Filter จาก Type หรือ Class ของข้อความซึ่งคุณสมบัติต่างๆใน โมเดล Publish /Subscribe ที่พูดถึงข้างต้นนี้ เราสามารถพบเจอได้ใน MQTT ใน MQTT Publisher และ Subscriber จะถูกแยกออกจากกัน เวลาที่ต้องการส่งหรือรับข้อความ ตัว Publisher/Subscriber ต้องการรู้เพียงแค่ Host/IP/Port ของตัว Broker เท่านั้นถึงแม้ว่าโดยปกติแล้ว MQTT จะรับส่งข้อมูลแบบเกือบ Real-Time​ (Near Real-Time) แต่ MQTT สามารถ Store ข้อความให้ Client ที่ Offline ได้ นอกจากนี้ โดยปติแล้ว MQTT ทำงานแบบ Asynchronous แต่ในบางกรณี MQTT ก็รองรับ Synchronous เช่นกัน ในด้านการ Filter ข้อความนั้น MQTT นั้นใช้วิธี Filter แบบ Subject-Basedเพื่อป้องกันปัญหาที่อาจจะเกิดขึ้นในระบบ Pub/Sub MQTT มีการใช้ QoS เพื่อใช้การันตีว่ามีการส่งข้อมูลเรียบร้อย ไม่ว่าจะส่งจาก Broker ไป Client หรือ จาก Client ไป Broker ซึ่งบางครั้งอาจจะเป็นไปได้ว่าไม่มี Clientไหน Subscribe ตัว Topic นี้เลย ดังนั้น ตัว Broker เองต้องมีวิธีที่จะจัดการกับเคสที่ว่าด้วยหลังจากทำความเข้าใจเบื้องต้นเกี่ยวกับระบบ Pub/Sub และ MQTT แล้ว จะเห็นได้ว่า MQTT นั้นมีความแตกต่างจาก Message QueueMessage Queue จะเก็บข้อความไว้จนกว่าจะถูกนำไปใช้โดย Client แต่ใน MQTT บาง Topic ก็ไม่มี Client ตัวไหนสนใจ Subscribe เลยข้อความใน Message Queue จะสามารถถูกนำไปใช้โดย Client รายเดียวเท่านั้น ซึ่งในขณะเดียวกัน MQTT ที่ไม่มีข้อจำกัดตรงนี้Queue ใน Message Queue ที่ถูกสร้างขึ้นและตั้งชื่อแล้วเท่านั้นถึงจะ Publish ได้ ซึ่งต่างจาก MQTT ที่สามารถสร้าง On the fly ได้Client, Broker and Connection Establishmentหลังจากที่พอเข้าใจคร่าวๆเกี่ยวกับ Pub/Subและ MQTT กันแล้ว เราลองมาทำความเข้าใจให้ละเอียดเกี่ยวกับ Client และ BrokerMQTT Client หมายถึง deviceใดๆก็ได้ที่ใช้ MQTT Library และมีการเชื่อมต่อกับ MQTT BrokerMQTT Broker ถือเป็นหัวใจสำคัญของระบบ Pub/Sub เลยทีเดียว หน้าที่สำคัญของ Broker ก็คือ การรับข้อความ และนำข้อความนั้นมา Filter เพื่อให้ทราบว่าจะต้องส่งต่อข้อความนั้นไปให้ Client ที่ Subscribe ไว้ตัวไหนบ้างเมื่อมี Client แล้ว มี Broker แล้ว สองตัวนี้จะต้องเชื่อมต่อกันเพื่อให้เกิด MQTT Connectionโดยเริ่มจากการส่ง CONNECT Message จาก Client ไป Broker หลังจากนั้น Broker จะตอบกลับด้วย CONNACK message และ Status Code ไปที่ Client การเชื่อมต่อจะถูกหยุดลงเมื่อ Client ส่งคำสั่ง Disconnect มาที่ BrokerMQTT Publish, Subscribe & UnsubscribeMQTT Client สามารถ Publish ข้อความได้ทันทีหลังจาก ทำการเชื่อมต่อกับ MQTT Broker ซึ่งในแต่ละข้อความนอกจากจะต้องมี Topic ที่ MQTT Broker สามารถนำไป Filter ได้แล้ว ยังมีส่วนของ Payload ที่มีข้อมูลที่ต้องการส่งหลากหลายรูปแบบ เช่น Text หรือ Image หรือ เกือบทุกรูปแบบที่สามารถอยู่ในรูปแบบของ Binaryได้และเมื่อ Client ต้องการรับข้อความใน Topic ที่สนใจ ซึ่งสามารถทำได้โดยการส่ง SUBSCRIBE Message ไปให้ Broker ซึ่ง ใน SUBSCRIBE Message นี้ก็จะมีลิส ของ Topic ที่ Client สนใจอยู่ และ Broker ทำการตอบรับด้วยการส่ง SUBACK MessageClient สามารถยกเลิกการรายการที่เคย Subscribe ไว้กับ Broker ด้วยการส่ง UNSUBSCRIBE Message และเช่นเคย Broker จะทำการตอบรับด้วยการส่ง UNSUBACK Message เพื่อเป็นการยืนยันกับ Client ว่าคำร้องขอยกเลิกได้ถูกคอนเฟิร์มแล้วMQTT TopicsMQTT Topic คือ UTF-8 String ที่ถูกใช้โดย Broker ในการ Filter ข้อความ ซึ่ง Topic สามารถมีได้หลายเลเวล แต่ละเลเวลจะถูกแบ่งด้วยเครื่องหมาย / (Slash) ในแต่ละ Topic ต้องมีอย่างน้อย 1 ตัวอักษรClient สามารถเลือกที่จะ Subscribe เฉพาะเจาะจง Topic หรือ สามารถ ใช้ Wildcard ในการเลือกรับหลายๆ Topic ซึ่งก็จะมีการใช้อยู่ 2 แบบ คือ แบบ Single Level และ แบบ Multi LevelSingle Level ( + ) Wildcard สามารถใช้แทนที่ Topic เพียง หนึ่ง เลเวล โดยใช้เครื่องหมาย + (Plus)Multi Level (#) Wildcard สามารใช้แทนได้มากกว่าหนึ่ง Topic ซึ่ง # (Sharp) จะต้องอยู่เป็นตัวอักษรสุดท้าย และต้องมี /(Slash) นำหน้าบทความนี้ก็อาจจะหนักหัวหน่อยนะคะ แต่รับรองคุ้มค่าที่จะรู้จักกับ MQTT ค่ะ แต่ยังมีความสามารถอีกหลายอย่างเลยที่เรายังไม่ได้พูดถึง เราจะค่อยๆเรียนรู้ไปด้วยกันนะคะ แล้วพบกันใหม่ในตอนหน้าค่ะ
โดย: Pii
| Blockchain
แก้ปัญหาเวเนซูเอล่าด้วยบล็อคเชน
ครั้งหนึ่งประเทศเวเนซูเอล่าเคยเป็นเมืองที่มีทรัพยากรอย่าง ทองและน้ำมัน อย่างเหลือเฟือ มีธรรมชาติที่สมบูรณ์สวยงามทั้งป่าเขาทะเล ผู้คนจากทั่วทุกมุมโลกได้ย้ายถิ่นฐานไปอาศัยที่นั่น ทำให้เวเนซูเอล่ากลายเป็นเมืองที่ได้ชื่อว่าเป็น Switzerland แห่ง Latin America มีความร่ำรวยมั่งคั่งเป็นอันดับต้นๆของโลกเลยทีเดียวจากวันนั้นมาวันนี้เวเนซูเอล่าไม่เหลือภาพในฝันดังกล่าวอีกต่อไป ผู้คนในประเทศต่างพยายามอพยพออก โรคร้ายที่เคยถูกกำจัดจนหายไปแล้วได้กลับมาระบาดอีกครั้งเนื่องจากการรักษาพยาบาลมีปัญหา เด็กๆในประเทศมีความเสี่ยงเสียชีวิตจากการขาดสารอาหาร ด้วยสภาพที่ประเทศขาดอาหารและยาเป็นอย่างมาก ผู้คนจึงต้องลักลอบเข้าไปหาจากประเทศโคลัมเบียและส่วนมากไม่กลับมาอีก รวมไปถึงค่าเงินโบลีวาร์ของประเทศเองก็มีความผันผวนอย่างมากตลอดเวลาสภาพของเวเนซูเอล่าตอนนี้คือรัฐบาลควบคุมสภาพเศรฐกิจของประเทศอย่างเข้มงวด การซื้อขายอาหารและยาในประเทศขาดความโปร่งใส อาหารถูกใช้เป็นข้อต่อรองข้อเสนอต่างๆ การโอนเงินจากต่างประเทศเข้ามาโดยเฉพาะกรณี Western Union จะถูกรัฐบาลหักไปถึง 56 เปอร์เซ็นในแต่ละครั้ง ก่อนที่จะแปรสภาพมาเป็นเงินโบลีวาร์ที่แทบไม่มีค่าอะไรเลย คนส่วนมากจึงตั้งราคาสินค้าต่างๆเป็นดอลล่า(เงินสหรัฐอเมริกา)หรือเปโซ(เงินโคลัมเบีย)เพราะมีความน่าเชื่อถือมากกว่าวันนี้บล็อคเชนจึงเป็นแสงสว่างเป็นทางออกเป็นคำตอบของชาวเวเนซูเอล่า โดยเป็นสื่อกลางการแลกเปลี่ยนระหว่างคนนอกประเทศและในประเทศที่ปราศจากการแทรกแซงจากรัฐบาลปัจจุบัน คนนอกจะซื้อเหรียญคริปโตและแลกเปลี่ยนกับคนในโดยที่คนในสามารถขายเหรียญคริปโตเป็น ดอลล่า หรือ เปโซ มาใช้จ่ายซื้อขายอาหารและยาได้ตามปกติสกุลเงินบล็อคเชนต่างๆสามารถสร้างระบบเศรฐกิจขึ้นอีกวงหนึ่งในประเทศเวเนซูเอล่าได้เอง การอาศัยอยู่ในประเทศที่ค่าเงินของประเทศผันผวนอย่างหนักตลอดเวลาก็เปรียบเสมือนเป็นทาสของรัฐบาลประเทศนั้นๆนั่นเอง(ทรัพย์สินจะมีค่าหรือไร้ค่าขึ้นอยู่กับการบงการของรัฐบาล) แต่การใช้สกุลเงินบล็อคเชนทำให้การแทรกแซงใดๆเป็นไปไม่ได้ ทำให้เศรฐกิจที่พึ่งค่าเงินนี้สามารถเดินหน้าต่อไปได้ สามารถซื้อขายแลกเปลี่ยนได้ทั้งภายในและภายนอกประเทศเองจากรายงานช่วงปลายปีที่แล้ว(พ.ศ. 2561) ชาวเวเนซูเอล่ารวมถึงชาวโคลัมเบียต่างเริ่มมีการใช้เหรียญ Dash อย่างกว้างขวางมากขึ้นเรื่อยๆ โดยในเดือนมกราคม มีร้านค้ารับเหรียญ Dash อยู่ 1 ร้าน จนสิ้นปีธันวาคม มีทั้งหมดประมาณ 350 ร้านค้า ซึ่งทีมงานผู้สร้างเหรียญ Dash ก็ได้ทำการลงพื้นที่เพื่อให้ข้อมูลผู้ใช้งานโดยตรงนี่เป็นเพียงตัวอย่างหนึ่งของการประยุกต์ใช้บล็อคเชนแก้ปัญหาขนาดใหญ่ระดับประเทศ ซึ่งแท้จริงแล้วเป็นแค่จุดเริ่มต้นของเทคโนโลยีนี้เท่านั้น วันนี้บล็อคเชนเป็นเครื่องมือสำคัญยิ่งในการกอบกู้สังคมหรือประเทศที่ล้มเหลวจากการบริหารของรัฐบาลหรือสถาบันขนาดใหญ่ใดๆ ในไม่ช้าเวเนซูเอล่าอาจเป็นบทพิสูจน์ให้โลกได้เห็นถึงศักยภาพความเป็นไปได้ของ บล็อคเชน เทคโนโลยีแห่ง ความเชื่อ(Trust) เป็นจุดเริ่มต้นของการเปลี่ยนแปลงสังคมมนุษย์สู่ยุคใหม่
โดย: Kan Ouivirach
| Machine Learning
Cross Validation กับ ML
บทความนี้เราจะมาทำให้โมเดล Machine Learning ของเราน่าเชื่อถือโดยใช้เทคนิคที่เรียกว่า Cross Validation กัน โดยทั่วไปแล้ว เราจะนำเอาเทคนิคนี้มาวัด Performance ของโมเดล เลือกโมเดลที่ดีที่สุดแล้ว นอกจากนี้เรายังนำเอา เทคนิคนี้มาช่วยป้องกันปัญหา Overfitting ที่ได้เขียนถึงในบทความ ปัญหา Overfitting ใน Machine Learning คืออะไร [link ไปบทความเก่า] อีกด้วยนะเมื่อก่อนคำถามที่ผมโดนถามบ่อยๆ เป็นคำถามแรกๆ เลย (หลายๆ คนก็น่าจะโดนถามเหมือนกัน) ตอนที่นำเสนอผลที่ได้จากโมเดล คือ “ได้ทำ Cross Validation มาหรือยัง?” ถ้าคำตอบคือยัง ก็แปลว่าเราไม่ต้องนำเสนอต่อล่ะ T Tเทคนิคนี้จึงเป็นเทคนิคที่สำคัญมาก ที่ทุกคนควรรู้และทำให้เป็นถ้าจะมาสายนี้ครับ เรามาทำความรู้จักกับมันกันดีกว่าชื่อวิธีการที่ใช้กันโดยทั่วไปคือ k-fold Cross Validation โดยที่ค่า k จะเป็นตัวเลขหนึ่งที่เราจะเลือกมาเพื่อแบ่งเป็นจำนวนของกลุ่มข้อมูล เช่น ถ้า k = 5 เราก็จะแบ่งข้อมูลออกเป็น 5 กลุ่ม (หรือ fold) นั่นเองสรุปขั้นตอนโดยรวมจะประมาณนี้สลับข้อมูลแบบ randomแบ่งข้อมูลออกเป็นกลุ่มตามจำนวน k ที่กำหนด สมมุติว่าเราแบ่งออกเป็น 5 กลุ่ม เพื่อให้เข้าใจง่ายขึ้นจะแสดงข้อมูลแต่ละกลุ่มเป็นตัวเลขแบบนี้ [1, 2, 3, 4, 5]เราจะนำข้อมูล 4 กลุ่ม เช่น [2, 3, 4, 5] ไปสอนโมเดล และอีก 1 กลุ่มที่เหลือ [1] ไปทดสอบโมเดล จดผลลัพธ์ไว้ เช่น จดค่า Accuracy ไว้พอเสร็จแล้ว รอบถัดไปเราก็จะนำข้อมูล [1, 3, 4, 5] ไปสอน และอีก 1 กลุ่มที่เหลือ [2] ไปทดสอบโมเดลทำแบบนี้วนไปจนกว่าเราจะได้ทดสอบกับกลุ่มข้อมูลครบทั้ง 5 กลุ่มพอทำครบเราก็จะนำเอาค่า Accuracy หรือค่าอื่นๆ ที่เราจดไว้มาหาค่าเฉลี่ย แล้วเราก็จะได้ Performance ของโมเดลของเราไปนำเสนอเป็นที่เรียบร้อย ^^ ถ้าเราอยากปรับปรุงโมเดลของเรา เราก็ทำ Cross Validation แบบนี้อีก แล้วดูว่าค่าเฉลี่ยที่เราได้มามีค่ามากขึ้นหรือเปล่า ถ้ามากขึ้นก็แปลว่าโมเดลเราดีขึ้นนั่นเองจะเห็นได้ว่าการทำแบบนี้ทำให้ข้อมูลผ่านโมเดลของเราทั้งหมด ลดความลำเอียงของโมเดลของเรา และทำให้โมเดลนั้นน่าเชื่อถือมากขึ้นเผื่อมีใครอยากลอง บทความก่อนหน้านี้เราลองเล่น Machine Learning โดยใช้ scikit-learn [link ไปบทความเก่า] ทีนี้ถ้าเราอยากลองทำ Cross Validation ล่ะ? ก็ทำได้ตามนี้เลย>>> from sklearn.cross_validation import cross_val_score>>> knn = KNeighborsClassifier(n_neighbors=5)>>> scores = cross_val_score(knn, X, y, cv=10, scoring=’accuracy’)>>> print(scores)[ 1. 0.93333333 1. 1. 0.86666667 0.933333330.93333333 1. 1. 1. ]จะเห็นได้ว่าเราไม่จำเป็นต้องแบ่งเป็น Training Data หรือ Test Data ก่อน เราสามารถโยนข้อมูลทั้งหมดทั้ง X และ y เข้าไปยัง cross_val_score ได้เลย โดยฟังก์ชั่นนี้จะไปแบ่งกลุ่มข้อมูลให้เราเองสุดท้ายถ้าอยากหาค่าเฉลี่ย เราก็>>> print(scores.mean())0.966666666667สุดท้ายแล้วก็อยากฝากไว้ครับว่าอย่าใจร้อนเอาโมเดลของเราไปใช้งานจริง ถ้าเห็นว่าผลของมันออกมาดี ซึ่งผลที่ออกมาดี อาจจะเป็นเพราะโมเดลของเรา Overfit ก็เป็นได้ อยากให้เสริมความมั่นใจด้วยการทำ Cross Validation กันก่อนทุกครั้งนะครับ :)
โดย: Laris
| IoT
มาเริ่มต้นเขียนโปรแกรม IoT กันดีกว่า
สวัสดีค่ะท่านผู้อ่านทุกท่าน วันนี้เราจะมาเริ่มเขียนโปรแกรมลงบนบอร์ด ESP32 ตามสัญญากันนะคะ ซึ่งบทความเราจะเริ่มติดต่อกับอุปกรณ์ IoT หรือว่าแตะฝั่ง Hardware กันแล้วค่ะ (ตื่นเต้นกันมั้ย :p) และเพื่อความง่ายต่อการเริ่มต้นเราจะใช้ Framework: Arduino มาเขียนโปรแกรมกันวันนี้ค่ะบอร์ด TTGO T8หากเราไปค้นคำว่า “Arduino” ใน Google เราอาจจะเจอ “บอร์ด Arduino” มากมายอย่าเพิ่งตกใจไปนะคะ เพราะว่า Arduino มีทั้ง Board และ Framework ซึ่งใบบทความนี้เราจะใช้ ESP32 Board ร่วมกับ “Framework Arduino” และ Hardware ที่จะใช้วันนี้คือบอร์ด TTGO T8 ซึ่งใช้ชิป ESP32 ของบริษัท Espressif Systems ค่ะ ส่วนใครที่มีบอร์ดอื่นๆที่เป็น ESP32 ก็สามารถเอามาใช้ได้เลยนะคะ บอร์ดนี้ใกล้มือผู้เขียน ติดกระเป๋ามาด้วย เลยหยิบมาทำ Demo ให้ดูกันค่ะเริ่ม ติดตั้ง Arduino กันก่อนทุกระบบปฏิบัติการ สามารถดาวน์โหลด Arduino IDE ได้ที่ https://www.arduino.cc/en/Main/Software แต่ ก็ยังมี Editor หรือ IDE อีกหลายตัวที่เรายังสามารถเขียน Arduino และ ESP32 อีกนะคะ แต่วันนี้เราไปลุยกับ Arduino IDE กันก่อนเนอะarduino.ccหลังจากนั้นเปิดโปรแกรมแล้วจะได้หน้าตาแบบภาพข้างล่างค่ะ แต่ Arduino IDE อย่างเดียวไม่สามารถเขียน ESP32 ได้ เราต้องลงเพิ่มอีกนิดหน่อยค่ะหน้าจอเขียนโปรแกรม Arduinoติดตั้ง ESP32 SDKเข้าเมนู Arduino → Preferences แล้วในช่อง Additional Boards Manager URLs ใส่ https://dl.espressif.com/dl/package_esp32_index.json (คลิ๊กเพื่อ อ่านเพิ่มเติม)หน้าจอ Preferencesเมื่อเข้ามา Board Manager แล้ว รอสักครู่ หลังจากนั้นเลือก esp32 by Espressif Systems แล้วกด Install ได้เลยค่ะติดตั้งบอร์ด ESP32 เริ่มต้นเขียนโปรแกรม Arduinoเริ่มต้นด้วยการ เปิดตัวอย่าง Blink ขึ้นมาจากเมนู Examples → Blinkแล้วทดสอบอัพโหลดโปรแกรม เอาฤกษ์ โดยการกดปุ่ม Sketch → Upload เอาชัยกันก่อนด้วยโปรแกรม Blink ค่ะ… (อย่าลืมแก้หมายเลข Pin ให้เป็นไปตามคู่มือของบอร์ดนะคะ อย่าง TTGO T8 จะเป็นขา 21ผลการรันโปรแกรม Blinkเริ่มต้นเขียนโปรแกรม IoTหลังจากผ่านด่านทดสอบกันมาแล้ว เราจะเริ่มมาเขียนโปรแกรมสำหรับเชื่อมในแบบ Internet of things กันค่ะ เราจะลองเล่นกันไปก่อนนะคะ แล้วจะค่อยๆกลับมาเรียนกันอีกทีตอนหลังค่ะ (อย่าเพิ่งตกใจกันไปก่อนหน้าาา)ซึ่งเราจะเริ่มกันด้วยลง Library: ArduinoJson (v5.13.3) และ CMMC MQTT Connector (v1.2.0) โดยการเข้าที่เมนู Sketch → Include Library → Manage Libraries กดค้นหาแล้วเลือก Install ได้เลยค่ะหลังจากนั้นเลือกเปิดตัวอย่าง basic_mqtt ขึ้นมาค่ะหน้าจอตัวอย่างโปรแกรม basic_mqttหลังจากนั้นเปิดหน้าต่าง _config.h แล้วแก้ไขข้อมูลเบื้องต้นของเราค่ะ ซึ่งเราเลือก MQTT Broker ของ hivemq มาใช้กันนะคะ (จากในภาพจะแก้หลักๆที่ DEVICE_NAME และ MQTT_PREFIX) ที่เหลือคงกันไว้เหมือนเดิมกันก่อนนะคะ_config.hหลังจากนั้นเกิด Serial Monitor ขึ้นมาก็จะเห็นภาพข้างล่างนี้ค่ะSerial Monitor Consoleหลังจากนั้นเราจะมาลองควบคุมอุปกรณ์เราผ่าน hivemq web client กันนะคะ แต่จะต่างกับบทความก่อนๆที่เราจะใช้ mosquitto_pub ซึ่งเป็น client แบบ native แต่ที่เรากำลังใช้กันเป็น webclient ซึ่งวิ่งบน websocket protocol ซึ่งจะ binding เข้ากับ mqtt protocol (ซึ่งเป็น tcp) และตรงข้อนี้จะเป็น Feature ของ MQTT Broker นะคะ ซึ่งไม่ได้ถูกกำหนดไว้ใน Spec ของ MQTT Standard นะคะ แต่เราค่อยมาพูดถึง MQTT กันต่อในบทความถัดๆไปกันนะคะส่วนวันนี้เราจะเข้า http://www.hivemq.com/demos/websocket-client/ ไปและกด connect กันก่อนได้เลยค่ะ ในช่อง Publish: Topic เราก็ใส่ Prefix และ Device Name ของเราไป อย่างในโค๊ดตัวอย่างก็จะใส่ MYAPP/DEVICE001/$/commandและสั่ง ON และ OFF เพื่อสั่งเปิดและ ปิดค่ะ (ตามในโค๊ดดูได้ที่ไฟล์ _receive.h ค่ะ)หน้าจอแสดง mqtt websocket clientหลังจากนั้นก็ลองกด Publish ดู ก็จะให้ผลแบบในภาพค่ะภาพสาธิตแสดงการ Publish ข้อมูลเข้าบอร์ด ESP32เท่านี้ก็จะสั่งงานเปิด-ปิด อุปกรณ์ IoT ของเราได้แล้วค่ะ ไม่ยากเลยใช่มั้ยคะหลังจากนี้เราจะเอา IoT Device มาเชื่อมต่อกับ Home Assistant กัน เพื่อเริ่มต้นทำ Home Automation กันนะคะ ส่วนรายละเอียดส่วนอื่นๆ ก็จะทยอยเพิ่มเติมให้ในบทความถัดๆไปเช่นกันนะคะ
โดย: Pii
| Blockchain
ทำความเข้าใจ อีเธอเรียม คอนแสตนติโนเปิ้ล 27 ก.พ. 2562 (ที่ถูกเลื่อน)
คนที่ลงทุนในเหรียญอีเธอเรียมไม่จำเป็นต้องรู้เรื่องเทคนิคนี้นะครับ การอัพเดทที่จะมีขึ้นจะไม่มีผลกระทบกับผู้ถือเหรียญอีเธอเรียมแต่อย่างใด บทสรุปการอัพเดทระบบอีเธอเรียมนี้เหมาะสำหรับนักพัฒนาและผู้สนใจในเทคโนโลยีนี้เป็นพิเศษหลังจากที่อีเธอเรียมถูกเลื่อนกำหนด hard fork(การอัพเดทระบบ) ออกไป จากกำหนดเดิมที่ block เบอร์ 7,080,000 ซึ่งควรจะมีขึ้นในช่วงวันเสาร์ที่ 19 มกราคม พ.ศ. 2562 ที่ผ่านมา มาเป็น block เบอร์ 7,280,000 แทน ซึ่งควรจะมีขึ้นในช่วงประมาณวันพุธที่ 27 กุมภาพันธ์ พ.ศ. 2562 สาเหตุเนื่องจากมีคนพบบั๊กใน EIP ที่ถูกเสนอขึ้น จึงได้มีการเลื่อนระยะเวลา fork ออกไป 2 แสนบล็อค หรือ 6 สัปดาห์ โดยประมาณEIP(Ethereum Improvement Proposal) หรือข้อเสนอเพื่อปรับปรุงระบบอีเธอเรียม ที่จะเกิดขึ้นในเวอร์ชั่นคอนแสตนทีนโนเปิ้ลนั้นมี 5 ข้อประกอบไปด้วยEIP 145: Bitwise shifting instructions in EVMข้อนี้คือการเพิ่ม Bitwise Shifting native function ให้ระบบทำงานได้ สะดวก เร็ว และประหยัดขึ้นEIP 1014: Skinny CREATE2ทำให้สามารถอ้างถึงและเรียกใช้ address ที่ยังไม่ได้ถูกสร้างขึ้นได้EIP 1052: EXTCODEHASH opcodeเพิ่มประสิทธิภาพการทำงานในส่วนการเช็ค bytecode ของตัว contractEIP 1234: Constantinople Difficulty Bomb Delay and Block Reward Adjustmentปรับค่าระบบให้เหมาะสมกับสภาพระบบปัจจุบันEIP 1283: Net gas metering for SSTORE without dirty mapsลดขั้นตอนการทำงานที่ไม่จำเป็นทำให้ระบบประหยัดขึ้นบั๊กที่กล่าวถึงด้านต้นถูกพบที่ EIP 1283 ช่องโหว่ดังกล่าวทำให้ระบบถูกโจมตีได้ด้วย Reentrancy Attacks ในช่วงที่กำหนดการถูกเลื่อนออกไป ได้มีทั้งคนที่เสนอให้ยกเลิก EIP 1283 ออกจากชุดอัพเดทนี้ และคนที่เสนอให้แก้ไขรายละเอียดบางส่วนของ EIP 1283 ใหม่ ซึ่งดูเหมือนได้มีการปรับแก้ EIP 1283 ไปเป็นที่เรียบร้อยแล้วความเร็วในการต่อบล็อค(เขียนข้อมูลลงระบบ) หลังจากการอัพเดทจะยังคงอยู่ที่ประมาณ 15 วินาทีเหมือนเดิม เนื่องจากมาตรฐานของระบบอีเธอเรียมต้องการความปลอดภัยและความเสถียรสูง ซึ่งความเร็วดังกล่าวอาจเร็วขึ้นได้อีกมากหลังการพัฒนา PoS(Prove of Stake) ในอนาคต ในส่วนของค่าใช้จ่ายในการใช้งานระบบ อาจลดลงได้มากน้อยตามกรณีที่การใช้งานที่ตรงกันกับการปรับปรุงระบบในรอบนี้สำหรับใครที่ต้องการติดตามการอัพเดทครั้งนี้แบบลงลึกถึง spec โค้ด และเทสเคส สามารถตามไปอ่านได้ ที่นี่ ส่วนใครที่สนใจ best practice สำหรับการพัฒนา application บน Ethereum สามารถศึกษาได้จากเว็บ Openzeppelin ครับ ซึ่งจริงๆแล้ว Openzeppelin เองก็มีโมดูลช่วยป้องกัน Reentrancy Attacks ดังกล่าวให้เรียบร้อยแล้วครับ
โดย: Kan Ouivirach
| Machine Learning
ปัญหา Overfitting คืออะไร
ปัญหา Overfitting คือ?แล้วจะรู้ได้อย่างไรว่าเจอปัญหานี้แล้ว?มีวิธีอะไรบ้างที่ใช้ป้องกัน?ปัญหา Overfitting คือ?Overfitting เป็นปัญหาที่ฮิตที่สุดในการทำ Machine Learning บอกได้เลยว่าเป็นปัญหาที่ทุกคนต้องเจอ และหลายๆ คนอาจจะพลาดพลั้งกับมันมาแล้ว รวมทั้งตัวผมเองด้วย T T ขอยกประโยคจาก Wiki มาเลยตามนี้In statistics, overfitting is “the production of an analysis that corresponds too closely or exactly to a particular set of data, and may therefore fail to fit additional data or predict future observations reliably”.การวิเคราห์ใดๆ ที่ผูกติดกับข้อมูลนั้นๆ มากเกินไป การวิเคราะห์นั้นจะไม่สามารถไปทำนายผลข้อมูลนอกเหนือจากนั้น หรือในอนาคตได้ ผมมักจะยกตัวอย่างของกบในกะลามาอธิบายรูปจากเว็บ 500pxกบในกะลาจะรู้จักแต่ข้อมูลที่อยู่ในกะลา เมื่อมันออกมาเห็นข้อมูลในโลกภายนอกแล้วมันจะตอบอะไรไม่ได้เลย :D นั่นแหละครับ ปัญหา Overfitting สุดฮิตของเรา หรือถ้าเราพูดในภาษา Machine Learning ก็จะพูดได้ว่า โมเดลของเรานั้นไม่ Generalize กับข้อมูลใหม่ๆ นั่นเองOverfitting เป็นปัญหาที่เราจำเป็นต้องแก้ เพราะว่าโมเดลของเราแปลผลลัพธ์จากข้อมูลผิดไปเลย แล้วเราก็ไม่สามารถนำโมเดลของเราไปทำนายผลอะไรได้เลย การฝืนนำเอาไปใช้จะส่งผลเสียมากกว่าผลลัพธ์แน่นอนโมเดลที่เราอยากได้คือโมเดลในรูปด้านล่างทางซ้าย (Just right!) จะเป็นโมเดลที่มีความสามารถ Generalize ข้อมูลได้ดีกว่า แล้วเวลามีข้อมูลใหม่ๆ เข้ามาจะทำนายผลได้ดีกว่าโมเดลทางขวา (overfitting)รูปจาก Quoraแล้วจะรู้ได้อย่างไรว่าเจอปัญหานี้แล้ว?วิธีตรวจสอบง่ายๆ วิธีหนึ่ง เราจะแบ่งข้อมูลออกเป็น 2 ชุด คือชุด Training Set และ Test Set แล้วลองดูค่า Metric อย่าง Accuracy ถ้าเราได้ค่า Accuracy จาก Training Set มากกว่าค่า Accuracy จาก Test Set เยอะๆ เช่น ได้ 99% Accuracy กับ Training Set แต่ได้ 50% กับ Test Set นั่นก็แปลว่าเราเจอ Overfitting แล้วครับอีกวิธีหนึ่งคือถ้าเราได้ 100% Accuracy กับ Training Set ก็ให้สงสัยไว้ก่อนเลยว่าเราเจอ Overfitting ครับ ให้นึกไว้เสมอเลยว่าไม่มีโมเดลอะไรที่ Perfectจริงๆ มีอีกหลายเทคนิคที่ใช้ตรวจสอบปัญหานี้นะ ซึ่งเทคนิคเหล่านั้นก็ประยุกต์เอาจากวิธีตรวจสอบที่กล่าวมา ;)มีวิธีอะไรบ้างที่ใช้ป้องกัน?จริงอยู่ที่ Overfitting เป็นปัญหาที่ฮิต แต่เราก็มีวิธีป้องกันนะ ใช้เทคนิคประมาณนี้เพิ่มจำนวนข้อมูลทำ Cross Validationทำ Feature Selection เอา Feature ที่ไม่สำคัญออก เลือกแต่ Feature ที่จำเป็นทำ RegularizationEarly StoppingEnsembling…จริงๆ มีอีกเยอะเลย จะค่อยๆ มาเล่าให้อ่านกันในบทความต่อๆ ไปนะครับ ^^

พบบทสัมภาษณ์ได้ที่นี่เร็ว ๆ นี้

พบDigital Skill บนสื่อ ได้ที่นี่เร็ว ๆ นี้

หมวดหมู่

พบหมวดหมู่ ได้ที่นี่เร็ว ๆ นี้

พบหมวดหมู่ ได้ที่นี่เร็ว ๆ นี้

Tags

พบคำสำคัญ ได้ที่นี่เร็ว ๆ นี้

พบคำสำคัญ ได้ที่นี่เร็ว ๆ นี้

พบคำสำคัญ ได้ที่นี่เร็ว ๆ นี้