มาลุยข้อมูลโซเชียลกันเถอะ

[post_ad]
การทำวิทยาศาสตร์ข้อมูล นอกจากทักษะการใช้เครื่องมือและความรู้เกี่ยวกับการใช้ข้อมูลแล้ว คนที่จะทำงานด้านวิทยาศาสตร์ข้อมูลแล้วได้ผลลัพธ์ที่น่าสนใจ
ผมไปอ่านเจอบทความหนึ่งนำเสนอโดย Kevin A Padrez และคณะตีพิมพ์ในวารสาร BMJ Quality & Safety เมื่อเดือนตุลาคมที่ผ่านมา ซึ่งศึกษาข้อมูลผู้ป่วยจำนวน 1,008 คน ที่อนุญาตให้ศึกษาข้อมูลการอัพเดทสถานะทั้งบนเฟซบุ๊กและทวิตเตอร์ โดยศึกษาว่า ข้อมูลสถานะต่าง ๆ ที่อัพเดทกันนั้น จะสามารถบ่งชี้ถึงสุขภาพของคนแต่ละคน และสุขภาพโดยรวมของประชากรได้อย่างไร และได้มากเพียงใด
จากบทความนี้ทำให้ผมนึกถึงวิชาการวิเคราะห์สื่อสังคมออนไลน์หรือที่เรียกว่า Social Network Analysis ที่เปิดสอนในภาควิชาวิศวกรรมคอมพิวเตอร์ จุฬาลงกรณ์มหา วิทยาลัย โดยมุ่งเป้าให้คนที่เรียน ได้ทักษะและความรู้เพื่อการวิเคราะห์สื่อสังคมออนไลน์ทั้งเฟซบุ๊ก ทวิตเตอร์ และอื่น ๆ
วิชานี้เพิ่งเปิดสอนเป็นครั้งแรก แต่ก็มีเรื่องราวน่าสนใจไม่น้อยเลยทีเดียวครับ
ต้องเรียนท่านผู้อ่านก่อนว่า ถ้าย้อนกลับไปอ่านบทความเก่า ๆ ที่ผมเคยพูดถึงเรื่องวิทยาศาสตร์ข้อมูล หรือ Data Science นั้น สิ่งสำคัญที่ผมบอกไว้ คือ การทำวิทยาศาสตร์ข้อมูล นอกจากทักษะการใช้เครื่องมือและความรู้เกี่ยวกับการใช้ข้อมูลแล้ว คนที่จะทำงานด้านวิทยาศาสตร์ข้อมูลแล้วได้ผลลัพธ์ที่น่าสนใจ จะต้องสามารถสังเกตและตั้งคำถาม ในสิ่งที่เป็นประโยชน์ หรืออย่างน้อย ก็เป็นที่น่าสนใจสำหรับคนทั่วไป เพื่อจะได้นำเอาผลลัพธ์ที่เกิดขึ้นไปต่อยอดได้
เราได้พบคำถามที่น่าสนใจไม่น้อย ซึ่งสามารถหาคำตอบได้จากโซเชียลเน็ตเวิร์ก (ด้วยการเขียนโปรแกรม และวิเคราะห์ข้อมูล) ไม่น้อยเลยทีเดียวครับ ซึ่งถ้าไล่จากบทความข้างต้นที่ผมยกมา รวมไปถึงคำถามน่าสนใจอื่น ๆ จากนักเรียนในชั้นเรียน ท่านผู้อ่าน อาจจะลองนำไปศึกษาเพิ่มเติมได้ ก็คงจะมีประโยชน์อยู่ไม่น้อยเลยทีเดียวครับเราลองมาดูกันครับ
(จากบทความด้านบน) สถานะในเฟซบุ๊กและทวิตเตอร์ สามารถนำมาใช้เพื่อประโยชน์ในการบ่งชี้สุขภาพของเจ้าของบัญชีได้หรือไม่ ประเภทสถานะพวกนี้ ได้แก่ สถานะที่บอกผลการตรวจสุขภาพ สถานะที่บอกอาการป่วย สถานะของการออกกำลังกาย เป็นต้นครับ
(จากข้อนี้เป็นต้นไป เป็นคำถามจากชั้นเรียนครับ) เราสามารถสรุปข่าว หรือเรื่องที่เกิดขึ้นในโซเชียลเน็ตเวิร์ก ได้หรือไม่ คำถามข้อนี้ นิสิตปริญญาเอก ณรงค์ อินทร์ธิรักษ์ และเป็นนักวิจัยที่เนคเทคด้วย ตั้งคำถามและทดลองค้นหาข้อมูลในทวิตเตอร์ และสามารถสรุปออกมาเป็นประโยคสั้น ๆ ได้ว่า “ระเบิดราชประสงค์มีผู้เสียชีวิต” ด้วยการเก็บรวบรวมข้อมูลทั่วไปในทวิตเตอร์ แล้วหาความถี่ของคำที่เกิดขึ้นมากที่สุดในช่วงเวลานั้น ทำให้ในปัจจุบัน เกิดคำถามต่อไปว่า นอกจากข่าวใหญ่ ๆ แบบนี้แล้ว เราจะค้นหาข่าวเล็ก ๆ แล้วเอามาร้อยเรียงเพื่อสรุปเหตุการณ์ได้หรือไม่
ระหว่างผู้ให้บริการโทรศัพท์มือถือยักษ์ใหญ่สามเจ้าของบ้านเรา ผู้ใช้บ่นเรื่องไหนมาก เรื่องไหนน้อย เจ้าไหนถูกบ่นเรื่องอะไร ซึ่งคำถามนี้ ถูกตั้งคำถามย้อนกลับไปว่า ถ้าเราวิเคราะห์ย้อนทาง แทนที่จะเริ่มต้นจากบริษัทผู้ให้บริการ แต่เริ่มต้นจากผลลัพธ์ เราอาจจะได้คำถามประเภท เมื่อคนนึกถึง สัญญาณอ่อน จะนึกถึงใคร หรือสัญญาณครอบคลุม จะนึกถึงใคร และถ้าคำถามนี้ยึดขยายไปไกลกว่าเดิมในเรื่องอื่น ๆ เราจะได้คำตอบที่น่าสนใจหรือไม่ เช่น ถ้าเริ่มต้นจากคำว่า “ความสุข” แทน “สัญญาณอ่อน” หรือ “สัญญาณครอบคลุม” เราจะพอรู้ได้หรือไม่ว่า คนไทยมีความสุขเรื่องใด ในช่วงเวลาใด เป็นต้น
คำแต่ละคำที่เกิดขึ้น มีความสัมพันธ์กันหรือไม่ เนื่องจากในช่วงที่เรียนตอนนั้น เป็นช่วงฝนตกบ่อย ทำให้นิสิตเกิดคำถามที่ดูง่าย ๆ แต่น่าสนใจ ว่า เวลาฝนตกจะสัมพันธ์กับเหตุการณ์ใด คำตอบของคำถามนี้ดูน่ารักทีเดียวครับ เพราะ เราพบว่า เวลาฝนตก คนมักจะพูดถึงอาการเหงา มากกว่า รถติด นะครับ
เหตุการณ์กับสถานที่ เนื่องจากในทวิตเตอร์เราจะสามารถระบุสถานที่ หรือจะให้ทวิตเตอร์ค้นหาสถานที่จากพิกัดบนพื้นโลกของเราก็ได้ครับ มีนิสิตคนหนึ่ง เกิดความสงสัยขึ้นว่า เวลาฝนตก คนมักจะหลบฝนอยู่ที่ไหน เลยลองค้นสถานที่ที่สัมพันธ์กับฝนตก ผลลัพธ์ที่พบ คือ “ห้องนอนสามี” กับ “วงไพ่ป๊อกเด้ง” ครับ (อาจเป็นแค่คนหรือสองคนที่พูดแบบนี้ แต่ก็ขึ้นมาอันดับหนึ่งและสองเมื่อเรียงตามความถี่ เพราะคนไม่ได้แท็กสถานที่มากนักในทวิตเตอร์)
ยังมีคำถามที่น่าสนใจอีกหลายคำถามทีเดียวครับ ซึ่งผมคิดว่า จะเป็นประโยชน์และนำไปต่อยอดเพื่อการศึกษาในด้านอื่น ๆ ต่อไปอีกมาก ถ้าผู้อ่านสนใจ สามารถส่งอีเมลมาสอบถามถึงวิธีการและแลกเปลี่ยนความเห็น รวมถึงส่งคำถามอื่น ๆ ที่นึกออกและอยากได้คำตอบ ส่งมาให้ผมที่อีเมลด้านล่างนะครับ แล้วผมจะคัดเลือกคำถามที่น่าสนใจ นำไปวิเคราะห์ หาคำตอบเอามาเล่าให้ฟังต่อไปครับ.
(source)
มาลุยข้อมูลโซเชียลกันเถอะ
Reviewed by sovanndy
on
7:53 PM
Rating:

No comments: