คุณลักษณะสำคัญของ บิ๊กดาต้า(Big Data)

, , Comments Off on คุณลักษณะสำคัญของ บิ๊กดาต้า(Big Data)

คุณลักษณะสำคัญของ บิ๊กดาต้า(Big Data) Big Data หมายถึงชุดข้อมูลใดๆ ก็ตามที่มีขนาดใหญ่และถูกเก็บบันทึกไว้ผ่านวิธีการต่างๆ ยกตัวอย่างเช่นฐานข้อมูลภายในองค์กรของคุณเอง ไม่ว่าจะเป็นข้อมูลการทำ transaction ต่างๆ หรือข้อมูลพฤติกรรมของลูกค้า

ปัจจุบันโลกกำลังถูกขับเคลื่อนด้วยเทคโนโลยีดิจิทัล ชุดข้อมูล (Data) จำนวนมากถูกสร้างขึ้นใหม่ทุกวัน และสามารถทำการเก็บรวบรวมได้ง่ายขึ้น ไม่ว่าจะเป็นพฤติกรรมการค้นหาข้อมูลทางอินเทอร์เน็ต การรับชมสื่อออนไลน์ หรือธุรกรรมสำคัญต่างๆ

บริษัท International Data Corporation (IDC) คาดการณ์ว่าปริมาณข้อมูล (Data) ที่เกิดขึ้นบน Digital Platform ภายในปี 2020 จะมีจำนวนมากถึง 40 Zettabyte หรือเทียบเท่ากับ 40 ล้านล้าน Gigabyte เลยทีเดียว

ชุดข้อมูลมหาศาลเหล่านี้มีประโยชน์อย่างมากต่อการทำ Customer Insight โดยเป็นส่วนสำคัญสำหรับนำไปพัฒนาระบบ AI เพื่อให้เข้าถึงลูกค้าได้อย่างตรงจุด ตัวอย่างเช่น Chatbot บนแพลตฟอร์ม Facebook เพื่อนำเสนอคำตอบที่ตรงใจ และชักจูงให้ลูกค้าสนใจสินค้าหรือบริการมากที่สุด

ดังนั้น ถึงเวลาแล้วที่แต่ละองค์กรควรจะเริ่มทำการเก็บข้อมูลและนำมาใช้ต่อยอดธุรกิจ การมีข้อมูลที่มากกว่าจะทำให้คุณทำความเข้าใจในสถานการณ์ต่างๆ ได้ดียิ่งกว่าคู่แข่ง ทำให้คุณสามารถแข่งขันและขึ้นไปยืนอยู่บนจุดสูงสุดของการทำธุกิจได้ หรืออาจกล่าวได้ว่า ข้อมูลยิ่งมีมากเท่าใดโอกาสที่จะประสบความสำเร็จขององค์กรก็มีมากเท่านั้น

โดย Big Data นั้นสามารถแบ่งเป็นหมวดหมู่ตามโครงสร้างของชุดข้อมูลได้ดังนี้

ข้อมูลที่มีโครงสร้างชัดเจน (Structured Data)

หมายถึง ชุดข้อมูลที่มีการจัดเรียงโครงสร้างอย่างเป็นระเบียบ มีความชัดเจน หรือระบุได้ด้วยตัวเลข พร้อมใช้งานได้ทันที เช่น จำนวนการซื้อขายกับลูกค้า เปอร์เซ็นต์ความเคลื่อนไหวภายในตลาดหุ้น ฯลฯ

ข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data)

หมายถึง ชุดข้อมูลที่มีโครงสร้างไม่ชัดเจน หรือไม่สามารถระบุความแน่นอนของข้อมูลนั้นๆ ได้ ยังไม่สามารถประมวลผลเพื่อนำไปใช้ได้ทันที อย่างเช่น บทสนทนาโต้ตอบกับลูกค้าทาง Social Media

ข้อมูลกึ่งมีโครงสร้าง (Semi-Structured Data)

หมายถึง ชุดข้อมูลที่มีโครงสร้างระดับหนึ่งแต่ยังไม่สมบูรณ์ เช่น สเตตัสใน Social Media เป็นข้อมูลที่ไม่มีโครงสร้าง แต่ในกรณีที่มี Hashtag (#) เข้ามาช่วยในการจัดหมวดหมู่ จะทำให้ข้อมูลมีความเป็นระเบียบขึ้นมาเล็กน้อย

คุณสมบัติของ Big Data นั้น จะมีลักษณะโดยรวมอยู่ 6 ประการด้วยกัน หรือที่มีการพูดถึงในชื่อ “5Vs 1C” โดยคุณลักษณะทั้ง 6 ของ Big Data นั้น มีดังนี้

1. ข้อมูลที่มีปริมาณมาก (Volume)

หมายถึง มีปริมาณข้อมูลอยู่มาก มีขนาดใหญ่ สามารถนับรวมได้ทั้งข้อมูลแบบออนไลน์และแบบออฟไลน์ โดยข้อมูลต้องมีขนาดใหญ่เกินกว่า Terabyte

ยกตัวอย่างเช่น การเข้าถึงอินเทอร์เน็ตของประชากรทั่วโลกที่มีจำนวนเพิ่มมากขึ้นทุกปี ซึ่งแต่ละคนมีพฤติกรรมการใช้งานข้อมูลที่หลากหลาย ทำให้ปริมาณของข้อมูลที่เกิดขึ้นมีจำนวนมหาศาล

2. ข้อมูลที่มีความหลากหลาย (Variety)

หมายถึง ข้อมูลแต่ละชนิดนั้นมีความหลากหลาย รวมกันทั้งรูปแบบมีโครงสร้าง ไม่มีโครงสร้าง และกึ่งโครงสร้าง

ยกตัวอย่างผ่านพฤติกรรมของ Social Media User ที่ในแต่ละวันสามารถสร้างชุดข้อมูลได้หลากหลาย เช่น การคอมเมนต์ลงในโพสต์ทาง Facebook จัดเป็นข้อมูลแบบไม่มีโครงสร้าง เพราะไม่สามารถคาดเดาคำตอบและโพสต์ที่เขาสนใจจากคอมเมนต์ได้

หรือการโพสต์ลงบน Twitter ที่สามารถจัด Category ของแต่ละโพสต์ผ่าน Hashtag ได้ แต่ก็ไม่สามารถระบุโครงสร้างหรือความหมายของ Hashtag นั้นได้อย่างชัดเจน นี่จึงจัดเป็นข้อมูลกึ่งโครงสร้าง

ส่วนข้อมูลที่ได้จากการตอบแบบสอบถามผ่าน Google Form ที่มีคำถามและคำตอบให้เลือกอย่างชัดเจน และข้อมูลนั้นสามารถนำไปใช้ต่อได้เลยทันที จะจัดว่าเป็นชุดข้อมูลแบบมีโครงสร้าง

เนื่องจากการใช้งานของ Social Media User นั้นไม่ได้เป็นระเบียบแบบแผนตายตัว ทำให้นอกจากมีปริมาณข้อมูลเกิดขึ้นอย่างมหาศาลแล้ว ข้อมูลเหล่านั้นยังเต็มไปด้วยความหลากหลายและซับซ้อนอีกด้วย

3. ข้อมูลที่มีการเพิ่มขึ้นอย่างรวดเร็ว (Velocity)

หมายถึง ข้อมูลที่มีการเพิ่มขึ้นและเกิดความเปลี่ยนแปลงอย่างรวดเร็ว ทำให้เกิดข้อมูลแบบ Real-time มากมาย อย่างเช่นข้อมูลการจราจร ซึ่ง Google Map ก็ได้ใช้ประโยชน์จากการเข้าถึง GPS ของผู้ที่สัญจรไปมาบนท้องถนน เพื่อวิเคราะห์และนำเสนอเส้นทางที่การจราจรคล่องตัวที่สุดให้กับผู้ใช้งาน

4. ข้อมูลที่สร้างประโยชน์นำไปใช้ในทางธุรกิจได้ (Value)

หมายถึง ข้อมูลที่มีคุณค่าต่อการนำไปใช้งาน สามารถก่อให้เกิดประโยชน์ทางธุรกิจได้เป็นอย่างดี ยกตัวอย่างเช่น พฤติกรรมการค้นหาข้อมูลผ่าน Google ที่ทำให้สามารถทราบถึงความสนใจของผู้คนในช่วงเวลานั้นๆ ได้

5. ข้อมูลต้องมีความถูกต้องชัดเจน (Veracity)

เนื่องจาก Big Data นั้นรวบรวมข้อมูลไว้เป็นจำนวนมหาศาล เพราะฉะนั้น สิ่งที่สำคัญที่สุดก็คือความถูกต้องชัดเจนของข้อมูล ซึ่งจะเป็นส่วนสำคัญที่จะสามารถนำข้อมูลเหล่านั้นมาประมวลผลเพื่อการใช้งานต่อในอนาคตได้

6. ข้อมูลต้องมีความเชื่อมโยงกัน (Complexity)

การจะใช้ประโยชน์จาก Big Data ได้นั้น มีอีกหนึ่งปัจจัยสำคัญนั่นก็คือความเชื่อมโยงกันของข้อมูล หากสิ่งที่รวบรวมมานั้นไม่สามารถหาจุดเชื่อมโยงกันได้ ข้อมูลเหล่านั้นก็ไร้ประโยชน์ การเก็บ Data ที่มีประสิทธิภาพนั้นจึงต้องคำนึงถึงความสัมพันธ์กันของข้อมูลด้วย