Sunday, February 2, 2014

อภิมหาข้อมูล : Big Data





หนังสือชื่อ :  อภิมหาข้อมูล (Big Data)

ผู้แต่ง  :  Viktor Mayer-Schonberger และ Kenneth Cukier

ผู้แปล  :  กวี รุจีรัตน์

สำนักพิมพ์  :  ทรูไลฟ์


ขายแล้วค่ะ!!!
         
                     
                 เป็นหนังสือด้านวิทยาศาสตร์และเทคโนโลยีที่น่าตื่นเต้นมากค่ะ อ่านแล้วทำให้ปฏิวัติความคิดที่เคยเรียนมาหลายอย่างเลยที่เดียว

                 ย้อนกลับไปสมัยที่เรียนวิทยาศาสตร์ อาจารย์จะบอกว่า การทดสอบ หรือการวิเคราะห์ตัวอย่างทางสิ่งแวดล้อมนั้น เนื่องจากประชากรของตัวอย่างมีเป็นจำนวนมาก เราจึงไม่สามารถตรวจสอบตัวอย่างทั้งหมดได้ ดังนั้น เราจึงจำเป็นต้องทำการ "สุ่มตัวอย่าง" โดยใช้หลักการทางสถิติเข้ามาช่วย เพื่อให้การสุ่มตัวอย่างนั้นมีความถูกต้อง เที่ยงตรง เป็นตัวแทนของสิ่งแวดล้อมทั้งหมด ...หลักจากนั้น ออยก็เรียนสถิติ เรียนเทคนิคการสุ่มตัวอย่างเเบบต่างๆ การหาความคลาดเคลื่อนของการสุ่ม เทคนิคการวิเคราะห์ต่างๆ ฯลฯ...
              ครั้นพอมาทำงานเป็นสาวโรงงาน ก็สุ่มตัวอย่างอีก นำตัวอย่างที่สุ่มได้ (โดยคาดหวังว่าจะเป็นตัวแทนของสินค้าทั้งล็อต) มาทำการวิเคราะห์ ได้ผลการทดลองมาอย่างเหนื่อยยาก ผลการทดลองที่ได้ จะใช้ในการพิสูจน์ว่า สินค้าทั้งล็อตนั้นได้มาตรฐานหรือไม่ ถ้าได้ ก็ปล่อยสินค้าออกจากโรงงาน จากนั้นเอกสารการทดลองนี้ ก็เก็บเข้าตู้ เป็นอันจบ จะหยิบมาใช้อีกครั้ง ก็ต่อเมื่อสินค้ามีปัญหา ลูกค้าร้องเรียน จึงจะทำการสืบกลับ เพื่อหาสาเหตุของปัญหา แต่โดยรวมแล้ว ผลการทดลองชิ้นนั้น หรือข้อมูลของสินค้าล็อตนั้น มักจะเก็บอยู่ในตู้เฉยๆ ไม่ได้มีใครไปทำอะไรกับมัน

               แต่เมื่อได้อ่านหนังสือเล่มนี้ ทำให้เรียนรู้ว่า ...โลกกำลังจะเปลี่ยนไปแล้วจ้ะ...เทคนิคการสุ่มตัวอย่างมีโอกาสที่จะเกิดความผิดพลาดได้ เช่น เมื่อมีการแบ่งหมวดย่อยของตัวอย่างข้อมูลมากๆ หรือเกิดจากความอคติของผู้สุ่มตัวอย่าง อีกทั้งการสุ่มตัวอย่าง ต้องการการวางแผนที่รัดกุมรอบคอบ เช่น การแบ่งกลุ่ม การเตรียมแบบสอบถาม ทำให้การสุ่มตัวอย่างไม่สามารถให้ผลที่รวดเร็วได้ และยิ่งเราพยายามสุ่มตัวอย่างจำนวนมากๆ ความทันสมัยของข้อมูลก็จะลดลง

                  ดังนั้นเทคนิคการสุ่มตัวอย่างจึงกำลังถูกแทนที่ด้วย...ไม่มีการสุ่ม...เอามันหมดเลย..ประชากรทั้งหมดคือตัวอย่าง หรือ N = all ...และนักสถิติกำลังถูกแทนที่ด้วยนักอัลกอริทึม

                 หนังสือเริ่มด้วยการเล่าเรื่องอันน่าทึ่งในปี 2009 ถึงการระบาดของไข้หวัดสายพันธ์ใหม่ ผู้เชื่ยวชาญในตอนนั้น วิตกกันมากว่า การระบาดครั้งนี้จะนำมาซื่งการเสียชีวิตเป็นจำนวนมาก หนทางที่จะยับยั้งการระบาดคือ การหาแหล่งกำเนิดของการระบาด และกำจัดบริเวณ เพื่อไม่ให้การระบาดแพร่กระจาย แต่ปัญหาคือ คนไข้มักจะมาหาหมอเมื่อไม่สบายหนักแล้ว ดังนั้นการทำนายการระบาดของโรงพยาบาล จึงจะช้ากว่าการระบาดที่เกิดขึ้นจริง...หากแต่ google กลับทำนายได้แม่นยำกว่า!!! ...แน่นอน..โดยใช้ big data หรือข้อมูลคำค้นหาของผู้ใช้ของ google ซึ่งมีเป็นจำนวนหลายล้านคำนั่นเอง

                หนังสือเล่มนี้เล่าเรื่องผลอันน่าแปลกใจ และดูไม่มีเหตุผลเลย เมื่อสถาบันวิจัยแห่งหนึ่งร่วมกับโรงพยาบาล สร้างโปรแกรมโดยใช้ข้อมูล big data เพื่อตรวจจับความเปลี่ยนแปลงแม้เพียงเล็กน้อยของทารกคลอดก่อนกำหนด ซึ่งอาจเป็นสัญญาณของการติดเชื้อภายใน 24 ชั่วโมง ผลการวิจัยปรากฏว่า สัญญาณชีพที่คงที่เกินไปมักจะเป็นสัญญาณการบอกล่วงหน้าของอาการติดเชื้ออย่างรุนแรง ซึ่งอาจทำให้เด็กน้อยถึงแก่ชีวิตได้...ซึ่งเป็นเรื่องที่ขัดกับหลักเหตุและผลของคนเราทั่วไป

               ดังนั้น...ยินดีต้อนรับสู่โลกของ Big data...โลกที่หลักเหตุและผลใช้การไม่ได้...มนุษย์เรายึดหลักการเหตุและผลในการใช้ชีวิต หากแต่เมื่อเหตุมีข้อมูงปัจจัยจำนวนมาก การประมวลผลจึงอาศัยเเนวโน้มความน่าจะเป็น โดยที่ไม่ได้คำนึงถึงหลักการเหตุและผล ดังนั้น ผลลัพธ์ที่ได้จากการประมวลผลโดยใช้ Big data บางครั้งก็ขัดแย้งกับความเข้าใจของเราๆ ...Big data จึงไม่ได้สนใจเรื่องเหตุผล หากสนใจเรื่องแนวโน้มการเกิดขึ้นของปรากฏการณ์มากกว่า เช่น ...ห้างค้าปลีกแห่งหนึ่งในอเมริกา ใช้อภิมหาข้อมูลเพื่อเพิ่มยอดขายสินค้าเด็กอ่อน พบว่าลูกค้าที่ตั้งครรภ์ได้เพียงสามเดือน (ซึ่งความเปลี่ยนแปลงทางร่างกายยังมองไม่เห็นภายนอก) จะซื้อโลชั่นแบบไร้กลิ่น และอีก 2-3 อาทิตย์ถัดมา พวกเธอจะซื้ออาหารเสริมบำรุงร่างกาย...นี่เป็นข้อมูลชิ้นดี โดยห้างไม่ต้องสนใจว่าทำไมพวกเธอจึงมีพฤติกรรมเช่นนั้นเหมือนกันหมด  สนใจเพียงแค่การส่งคูปองลดราคาสินค้าเด็กอ่อนให้เธอก็พอ

                หนังสือยังมีหลายตัวอย่างที่น่าทึ่งค่ะ ของการนำอภิมหาข้อมูลมาใช้ ทั้งในทางด้านธุรกิจ การค้า วิทยาศาสตร์ ฯลฯ และนอกจากจะกล่าวถึงการนำ big data มาใช้ประโยชน์แล้ว ในหนังสือ ยังพูดถึงโทษ เรื่องเกี่ยวกับความเป็นส่วนตัว (ข้อมูลการใช้อินเตอร์เน็ต การรูดเครดิตการ์ดของเรา ข้อมูลส่วนตัวอื่นๆ ของเรา กลายเป็นส่วนหนึ่งของ big data ที่บริษัทเหล่านี้ สามารถนำมาประมวล และทำเงินได้..แต่เรากลับไม่ได้อะไร เผลอๆ อาจได้รับความรำคาญ หรือรู้สึกคุกคามกับการละเมิดสิทธิส่วนบุคคลก็เป็นได้) หรือ ในหนังสือ ยังกล่าวถึงผลกระทบในอนาคตของการใช้อภิอหาข้อมูลในทางที่ผิด เพราะข้อมูลที่ได้จากการประมวลผล เป็นเพียงแนวโน้มของความเป็นไปได้ แต่ไม่ได้หมายความว่าจะถูกต้อง 100% หรือจะเป็นไปตามคำทำนายเสมอไป

                   เป็นหนังสือที่น่าสนใจอีกเล่มเลยทีเดียวค่ะ อาจจะมีติบ้าง ก็ตรงที่รูปแบบการจัดเรียงเนื้อหา ไม่ค่อยดี ทำให้ตัวหนังสือติดกันเป็นพรืด ทำให้ดูง่วงนอน ไม่น่าอ่าน แต่เนื้อหาในหนังสือ น่าสนใจเชียวค่ะ ใกล้ตัวเรามากๆ ด้วย 

                     หากสนใจหนังสือเล่มนี้ ยังหาซื้อได้ที่ร้านซีเอ็ดนะคะ หรือจะซื้อต่อจากออยก็ได้ ในราคาลดถึง 50%  เหลือเพียง 175 บาท บวกค่าจัดส่งทาง EMS อีก 50 บาทค่ะ สนใจติดต่อได้ที่ kasibanoy@gmail.com ค่ะ

No comments:

Post a Comment