Data Visualization (เล่าข้อมูลด้วยภาพ)
"CRAFT LAB: Make every technology commercialized"
"CRAFT LAB: Make every technology commercialized"
Data Visualization (เล่าข้อมูลด้วยภาพ) เลื่อกใช้แผนภูมิให้ถูกประเภท (Bar, Scatter, Heatmap, Line)
ข้อมูลอยู่ทุกหนทุกแห่ง เป็นกระแสที่หลั่งไหลอย่างต่อเนื่องของตัวเลข ข้อความ และข้อสังเกต แต่ข้อมูลดิบก็เหมือนอัญมณีที่ยังไม่ได้รับการเจียระไน มักซ่อนความงามและคุณค่าที่แท้จริงไว้ เพื่อให้เราเข้าใจและสื่อสารเรื่องราวที่อยู่ภายใน เราจำเป็นต้องทำให้ข้อมูลมีชีวิตขึ้นมาผ่านศิลปะและวิทยาศาสตร์แห่ง การแสดงข้อมูลด้วยภาพ (Data Visualization)
ส่วนที่ 1: การแสดงภาพตัวแปรเดียว – ทำความเข้าใจพื้นฐาน
เมื่อเรามีตัวแปรเดียว เป้าหมายของเราคือการทำความเข้าใจการกระจาย ตัวกลาง และการกระจายตัวของข้อมูล สิ่งนี้ช่วยให้เราเข้าใจลักษณะพื้นฐานของข้อมูลของเรา
1. แผนภูมิแท่ง (Bar Chart): ข้อมูลเชิงหมวดหมู่ในพริบตา
แผนภูมิแท่ง เหมาะสำหรับการแสดงภาพ ข้อมูลเชิงหมวดหมู่ (Categorical Data) ซึ่งแสดงถึงกลุ่มหรือประเภทที่แตกต่างกัน ความยาวของแต่ละแท่งสอดคล้องกับความถี่หรือสัดส่วนของการสังเกตภายในหมวดหมู่นั้นๆ
ในแผนภูมิแท่งนี้ เราสามารถเห็นได้อย่างง่ายดายว่า "สีน้ำเงิน" เป็นสีที่ได้รับความนิยมมากที่สุด ในขณะที่ "สีแดง" ได้รับความนิยมน้อยที่สุดในบรรดาตัวเลือกที่ระบุไว้
2. ฮิสโตแกรม (Histogram): เผยรูปร่างของข้อมูลเชิงปริมาณ
ฮิสโตแกรม ใช้สำหรับ ข้อมูลเชิงปริมาณ (Numerical Data) (หรือที่เรียกว่าข้อมูลเชิงตัวเลข) โดยแสดงให้เห็นการกระจายตัวของตัวแปรต่อเนื่องโดยการแบ่งข้อมูลออกเป็น "ช่วงชั้น (bins)" แล้วนับจำนวนจุดข้อมูลที่ตกอยู่ในแต่ละช่วงชั้น ความสูงของแต่ละแท่งแสดงถึงความถี่ของจุดข้อมูลในช่วงชั้นนั้นๆ
ฮิสโตแกรมนี้เผยให้เห็นว่ากลุ่มผู้เข้าร่วมที่ใหญ่ที่สุดอยู่ในช่วงอายุ 40-49 ปี และมีผู้เข้าร่วมน้อยกว่าในกลุ่มอายุที่น้อยที่สุดและมากที่สุด
ส่วนที่ 2: การแสดงภาพความสัมพันธ์ระหว่างสองตัวแปร – ค้นหาความเชื่อมโยง
เมื่อเราเข้าใจตัวแปรแต่ละตัวแล้ว ขั้นตอนต่อไปคือการสำรวจว่าตัวแปรสองตัวมีปฏิสัมพันธ์กันอย่างไร ซึ่งมักจะเปิดเผยความสัมพันธ์ ความขึ้นต่อกัน และความสัมพันธ์ที่น่าสนใจ
1. ตารางความถี่ร่วม (Contingency Table): การจัดกลุ่มข้อมูลเชิงหมวดหมู่ไขว้
ตารางความถี่ร่วม (หรือที่เรียกว่า Cross-Tabulation) เป็นวิธีที่มีประสิทธิภาพในการแสดงความสัมพันธ์ระหว่าง ตัวแปรเชิงหมวดหมู่สองตัว โดยจะแสดงการแจกแจงความถี่ของตัวแปรในแถวและคอลัมน์
ตัวอย่าง: ลองพิจารณาความสัมพันธ์ระหว่างเพศและรสชาติไอศกรีมที่ชอบ
จากตารางนี้ เราจะเห็นได้ว่าผู้ชายชอบช็อกโกแลตมากกว่า ในขณะที่ผู้หญิงชอบวานิลลามากกว่า
2. แผนภูมิคอลัมน์แบบซ้อน (Stacked Column Chart): แสดงภาพสัดส่วนในหมวดหมู่ต่างๆ
แผนภูมิคอลัมน์แบบซ้อน เป็นส่วนขยายของแผนภูมิแท่ง ใช้เพื่อเปรียบเทียบส่วนต่างๆ ของทั้งหมดในหมวดหมู่ที่แตกต่างกัน คอลัมน์แต่ละคอลัมน์แสดงถึงหมวดหมู่หนึ่ง และส่วนต่างๆ ภายในแต่ละคอลัมน์แสดงถึงสัดส่วนของตัวแปรเชิงหมวดหมู่ที่สอง
ตัวอย่าง: ลองแสดงข้อมูลความชอบไอศกรีมเดียวกันนี้โดยใช้แผนภูมิคอลัมน์แบบซ้อน
ในแผนภูมิคอลัมน์แบบซ้อนนี้ เราสามารถเปรียบเทียบการกระจายของรสชาติที่ชอบภายในแต่ละเพศได้ด้วยภาพ มันชัดเจนว่าแม้ว่าทั้งสองเพศจะชอบช็อกโกแลต แต่สัดส่วนของมันก็สูงกว่าอย่างเห็นได้ชัดในกลุ่มผู้ชาย
3. แผนภาพการกระจาย (Scatterplot): สำรวจความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณ
แผนภาพการกระจาย เป็นเครื่องมือพื้นฐานสำหรับการแสดงภาพความสัมพันธ์ระหว่าง ตัวแปรเชิงปริมาณสองตัว จุดแต่ละจุดบนกราฟแสดงถึงการสังเกต โดยตำแหน่งจะถูกกำหนดโดยค่าของตัวแปรทั้งสอง สิ่งนี้ช่วยในการระบุความสัมพันธ์ กลุ่ม และค่าผิดปกติ
ตัวอย่าง: ลองดูความสัมพันธ์ระหว่างชั่วโมงที่ใช้ในการอ่านหนังสือกับคะแนนสอบ
แผนภาพการกระจายนี้แสดงความสัมพันธ์เชิงบวกที่ชัดเจน: เมื่อจำนวนชั่วโมงที่ใช้ในการอ่านหนังสือเพิ่มขึ้น คะแนนสอบก็มีแนวโน้มที่จะเพิ่มขึ้นเช่นกัน เส้นประแสดงถึงแนวโน้มทั่วไป
ส่วนที่ 3: การแสดงภาพความสัมพันธ์ระหว่างตัวแปรสองตัวขึ้นไป – ค้นพบข้อมูลเชิงลึกหลายตัวแปร
เมื่อเราแนะนำตัวแปรที่สามหรือแม้แต่ตัวแปรที่สี่ การแสดงภาพของเราจะยิ่งเข้มข้นขึ้น ทำให้เราสามารถค้นพบความสัมพันธ์ที่ละเอียดอ่อนและซับซ้อนมากขึ้น
1. แผนภาพการกระจายพร้อมตัวแปรเชิงหมวดหมู่: เพิ่มมิติด้วยสีหรือรูปร่าง
เราสามารถปรับปรุงแผนภาพการกระจายมาตรฐานได้โดยการแนะนำ ตัวแปรเชิงหมวดหมู่ ผ่านสี รูปร่าง หรือขนาดที่แตกต่างกันของจุด สิ่งนี้ช่วยให้เราเห็นว่าความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณสองตัวเปลี่ยนแปลงไปอย่างไรในหมวดหมู่ต่างๆ
ตัวอย่าง: ลองเพิ่ม "เพศ" ลงในแผนภาพการกระจาย "ชั่วโมงที่ใช้ในการอ่านหนังสือเทียบกับคะแนนสอบ" ของเรา
แผนภาพนี้เผยให้เห็นความสัมพันธ์เชิงบวกระหว่างชั่วโมงที่ใช้ในการอ่านหนังสือกับคะแนนสอบสำหรับทั้งสองเพศ และอาจเน้นความแตกต่างเล็กน้อยในคะแนนเฉลี่ยหรือการกระจายระหว่างเพศชายและเพศหญิงที่ระดับชั่วโมงการอ่านที่แตกต่างกัน
2. แผนภาพฟอง (Bubble Plot): ตัวแปรเชิงปริมาณสามตัวในมุมมองเดียว
แผนภาพฟอง เป็นส่วนขยายของแผนภาพการกระจาย โดยที่ ตัวแปรเชิงปริมาณที่สาม ถูกแทนด้วยขนาดของฟอง สิ่งนี้ช่วยให้เราเห็นภาพสามมิติเชิงปริมาณพร้อมกัน
ตัวอย่าง: ลองจินตนาการว่าเรากำลังดูข้อมูลการขาย โดยที่แกน X คือค่าใช้จ่ายในการโฆษณา แกน Y คือรายได้ และขนาดของฟองแสดงถึงกำไร
ฟองที่ใหญ่ที่สุด (กำไรสูงสุด) มักจะอยู่ในควอแดรนต์บนขวา ซึ่งบ่งชี้ว่าค่าใช้จ่ายในการโฆษณาที่สูงขึ้นมักจะนำไปสู่ทั้งรายได้ที่สูงขึ้นและกำไรที่สูงขึ้น
3. แผนภูมิเส้น (Line Chart): ติดตามแนวโน้มเมื่อเวลาผ่านไป
แผนภูมิเส้น ได้รับการออกแบบมาโดยเฉพาะเพื่อแสดง แนวโน้มเมื่อเวลาผ่านไป โดยจะเชื่อมต่อจุดข้อมูลด้วยเส้น ทำให้ง่ายต่อการดูว่าตัวแปรเชิงปริมาณเปลี่ยนแปลงไปอย่างไรตลอดช่วงเวลาที่ต่อเนื่อง
ตัวอย่าง: ลองติดตามปริมาณการเข้าชมเว็บไซต์รายเดือนสำหรับบล็อก
แผนภูมิเส้นนี้แสดงให้เห็นอย่างชัดเจนถึงแนวโน้มขาขึ้นอย่างต่อเนื่องของปริมาณการเข้าชมเว็บไซต์ตลอดทั้งปี โดยมีช่วงที่ลดลงอย่างเห็นได้ชัดในช่วงฤดูร้อน เรายังสามารถเห็นการเติบโตของผู้ติดตามใหม่ได้ด้วย
4. ฮีทแมพ (Heat Map): ค้นพบรูปแบบในข้อมูลตาราง
ฮีทแมพ ใช้สีเพื่อแสดงขนาดของค่าในเมทริกซ์หรือตาราง เหมาะอย่างยิ่งสำหรับการแสดงภาพรูปแบบ ความสัมพันธ์ และความผิดปกติในชุดข้อมูลที่ซับซ้อน โดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับตัวแปรเชิงหมวดหมู่สองตัวและตัวแปรเชิงปริมาณหนึ่งตัว
ตัวอย่าง: ลองสร้างฮีทแมพที่แสดงคะแนนความพึงพอใจของลูกค้าสำหรับคุณสมบัติผลิตภัณฑ์ต่างๆ ในกลุ่มประชากรที่หลากหลาย
ฮีทแมพนี้ดึงดูดความสนใจของเราไปยังพื้นที่ที่มีความพึงพอใจสูง (สีเขียว) และต่ำ (สีแดง) ทันที ตัวอย่างเช่น กลุ่มประชากรที่มีอายุมากกว่าดูเหมือนจะพึงพอใจโดยทั่วไปกับ "อายุการใช้งานแบตเตอรี่" และ "การสนับสนุนลูกค้า" ในขณะที่ "ความง่ายในการใช้งาน" อาจเป็นพื้นที่ที่ต้องปรับปรุงในเกือบทุกกลุ่มอายุ
บทสรุป: พลังของการเล่าเรื่องด้วยภาพ
ตั้งแต่แผนภูมิแท่งแบบง่ายไปจนถึงฮีทแมพที่ซับซ้อน การแสดงข้อมูลด้วยภาพมอบเครื่องมือที่ขาดไม่ได้สำหรับการทำความเข้าใจ วิเคราะห์ และสื่อสารข้อมูลเชิงลึก ด้วยการเลือกการแสดงภาพที่เหมาะสมสำหรับประเภทข้อมูลและคำถามที่คุณพยายามตอบ คุณสามารถเปลี่ยนตัวเลขดิบให้เป็นเรื่องราวภาพที่น่าสนใจซึ่งขับเคลื่อนการตัดสินใจอย่างมีข้อมูล
หากมีข้อคิดเห็นหรือเสนอแนะใดๆ ทักมาคุยกัหรือแอดมาเป็นเพื่อนกันที่ https://www.facebook.com/kmuttentrepreneurship/
หลักสูตรการจัดการการเป็นผู้ประกอบการ นวัตกรรม และความยั่งยืน (#EPM) เป็นหลักสูตรภายใต้การกำกับดูแลของบัณฑิตวิทยาลัยการจัดการและนวัตกรรม (#GMI) มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี (#KMUTT)
สามารถสอบถามเพิ่มเติมได้ที่ (02) 470-9799, (02) 470-9795-6, 084-676-5885
LINE : @GMIKMUTT
หรือ ดูรายละเอียดเพิ่มเติม https://gmi.kmutt.ac.th/th/study-with-us/epm/
สนใจสมัครได้ที่ https://bit.ly/GMI_Apply
CRAFT LAB เตรียมความพร้อมในการพัฒนานักวิจัยให้เป็นผู้จัดการผลิตภัณฑ์ที่สามารถมีทักษะและความรู้ที่ควรเป็น อย่างมีผลลัพธ์ สนใจทักมาคุยกับได้ที่ Line: @061jlshn หรือดูข้อมูลเพิ่มเติมได้ที่นี่
เรื่องที่น่าสนใจอื่น
ลิงค์ที่เกี่ยวข้อง
สำหรับท่านที่ต้องการต่อยอดความรู้ระดับ 'ปริญญาโท' ด้านความเป็นผู้ประกอบการนวัตรกรรมสามารถคลิกที่นี่เพื่อดูข้อมูลเพิ่มเติม
เพิ่มเราเป็นเพื่อนในเฟสบุ๊คเพื่อรับข่าวสารและข้อมูลต่อยอดความเข้าใจ