data science (วิทยาการข้อมูล)

ปัจจุบันเราอยู่ในยุค Big Data และทุกธุรกิจล้วนต้องอาศัยข้อมูล (Data) ในการตัดสินใจเรื่องสำคัญ ๆ จึงเกิดกระบวนการต่าง ๆ ที่ช่วยทำให้คนเราเข้าใจ และนำข้อมูลมาใช้เพื่อวางกลยุทธ์การตลาดให้กับธุรกิจได้อย่างมีประสิทธิภาพมากขึ้น ดังเช่นการทำ Data Science หรือวิทยาการข้อมูล แล้ว Data Science คืออะไร มีหน้าที่อะไร รวมถึงมีกระบวนการทำงานอย่างไรบ้าง บทความนี้ Digital Tips ได้รวบรวมคำตอบเกี่ยวกับเรื่อง Data Science และสายอาชีพที่เกี่ยวข้องมาฝากคุณแล้ว รายละเอียดจะเป็นอย่างไร ตามไปดูพร้อมกันเลย!

Data Science (วิทยาการข้อมูล) คืออะไร

วิทยาการข้อมูล Data Science หมายถึง ศาสตร์ที่เกี่ยวกับการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัยข้อมูล และนำเสนอผลการวิเคราะห์หา Insight หรือข้อมูลเชิงลึก เพื่อนำมาใช้ประโยชน์ในงานด้านต่าง ๆ เช่น ด้านธุรกิจ โลจิสติกส์ เศรษฐศาสตร์ การเงิน การแพทย์ วิศวกรรม สารสนเทศ สาธารณสุข ฯลฯ โดยสามารถนำมาใช้ทำนายผลการทำธุรกิจในอนาคตได้ อาทิ ทำนายว่าเทรนด์อะไรกำลังมา สินค้าไหนจะขายดี และยังช่วยเป็นเข็มทิศให้กับผู้ที่มีอำนาจตัดสินใจ ให้สามารถปรับปรุงหรือเปลี่ยนแปลงทิศทางในการทำธุรกิจให้ถูกต้องเหมาะสม ตามแนวคิด “ข้อมูลสู่ความรู้สู่ภูมิปัญญา” อีกด้วย

Data Science หรือ วิทยาการข้อมูล คืออะไร

ทั้งนี้ ผลลัพธ์ของการทำ Data Science จะเรียกว่า Data Products หรือผลิตภัณฑ์ข้อมูล โดย Data Products ที่มีค่ามากที่สุด ก็คือองค์ความรู้ สติปัญญา ภูมิปัญญา และการตัดสินใจ ซึ่งทำให้ธุรกิจได้รับคำแนะนำ การบริการ การทำนาย การตัดสินใจ กรอบความคิด แบบจำลอง รูปแบบ กระบวนทัศน์ เครื่องมือ หรือระบบที่ช่วยทำให้สามารถนำธุรกิจเดินทางไปสู่เส้นทางที่ถูกต้องได้ ไม่ว่าจะเป็นการทำ Digital Marketing หรือวางแผนในเรื่องใด ๆ ก็ตาม เราจึงสามารถสรุปได้ว่า Data Science คือ หนึ่งในหนทางที่พาธุรกิจมุ่งสู่ความสำเร็จอย่างแท้จริง

Data Scientist คืออะไร มีหน้าที่ทำอะไรบ้าง?

เมื่อพูดถึงการทำ Data Science เราก็จะต้องพูดถึงตำแหน่งงานที่เกี่ยวข้องกับ Data Science ด้วย ซึ่งตำแหน่งนี้มีชื่อเรียกว่า Data Scientist นั่นเอง แล้ว Data Scientist คืออาชีพอะไร  Data Scientist ทำหน้าที่อะไรบ้าง หัวข้อนี้ มีคำตอบ!

Data Scientist คืออะไร 

หากคุณสงสัยว่าคนที่ดูแลเรื่อง Data Science ทำงานอะไร คำตอบอยู่ใน Job Description ของ Data Scientist โดย Data Scientist คือ นักวิทยาศาสตร์ข้อมูล หรือนักวิทยาการข้อมูล ที่ได้ชื่อว่าเป็นผู้เชี่ยวชาญที่ใช้วิธีการทางวิทยาศาสตร์ เพื่อทำความเข้าใจกับข้อมูลต่าง ๆ โดยจะต้องความรู้แบบสหวิทยาการ (Interdisciplinary) หรือมีองค์ความรู้ในหลากหลายด้าน เช่น ความรู้ด้านวิทยาการคอมพิวเตอร์ (Computer Science), ความรู้ด้านคณิตศาสตร์และสถิติ (Math&Statistics), ความรู้เฉพาะสาขา (Domain Knowledge), ความอยากรู้อยากเห็นและความคิดสร้างสรรค์ (Curiosity & Creativity) เป็นต้น

คุณสมบัติของ Data Scientist 

แน่นอนว่างานที่เกี่ยวกับ Data Science เริ่มต้นและจบลงที่ “ข้อมูล” ดังนั้น สำหรับการเป็น Data Scientist คุณสมบัติหลัก ๆ ที่จะต้องมีก็คือ “ความหลงใหลในข้อมูล” กล่าวคือ เป็นคนชอบค้นหา สืบเสาะ วิเคราะห์ และประมวลผล รวมทั้งสามารถใช้ชีวิตอยู่ท่ามกลางตัวหนังสือและตัวเลขเป็นจำนวนมากได้ตลอดทั้งวัน เพราะ Data Scientist คือ คนที่เปรียบได้กับหนังสือเล่มใหญ่ ซึ่งมีไว้เพื่อเป็นคู่มือประกอบการตัดสินใจในทุก ๆ เรื่องเกี่ยวกับธุรกิจนั่นเอง

Data Scientist มีหน้าที่ทำอะไรบ้าง

“Data Scientist ทำหน้าที่อะไร?”

สำหรับ Data Scientist หน้าที่หลัก ๆ จะเกี่ยวข้องกับการเก็บข้อมูล จัดการข้อมูล วิเคราะห์ข้อมูล นำข้อมูลมาช่วยตัดสินใจ ด้วยการใช้เทคโนโลยีเพื่อจัดการกับข้อมูลขนาดใหญ่ โดยจะต้องออกแบบโมเดลของข้อมูล ใช้ Machine Learning หรือเขียนโปรแกรม เพื่อนำข้อมูลจากหลาย ๆ แหล่งมาประกอบในโมเดล ตัวอย่างเช่น Marketing, Logistic, Manufacturing เป็นต้น จนออกมาเป็นโมเดลที่นำไปใช้ได้จริง 

นอกจากนี้ Data Scientist ที่ดี ยังจะต้องเข้าใจความต้องการของผู้บริโภค และสามารถช่วยกำหนดทิศทางธุรกิจด้วยข้อมูลที่มีได้อีกด้วย ด้วยเหตุนี้ ทุก ๆ องค์กรที่จำเป็นต้องทำ Data Science ไม่ว่าจะเป็นธุรกิจแบบ B2B หรือ B2C เช่น ธุรกิจการเงินและธนาคาร ธุรกิจ E-Commerce และเว็บไซต์ ธุรกิจค้าปลีกค้าส่ง หรือ ธุรกิจโทรคมนาคม จึงจำเป็นต้องมี Data Scientist 

อ่านเพิ่มเติม: ธุรกิจรูปแบบ B2B คืออะไร

Hard Skill ของ Data Scientist มีอะไรบ้าง 

สำหรับเรื่อง Hard Skill นั้น คนที่ทำงานด้าน Data Science จะต้องเชี่ยวชาญเรื่อง Machine Learning อาทิ SQL Server, Oracle และ SAP รวมถึงภาษาที่ใช้ในการเขียนโปรแกรมต่าง ๆ เช่น JavaScript, Python และ SQL นอกจากนี้ ยังต้องมีความรู้ความใจเรื่องการตลาดออนไลน์ อาทิ Marketing Funnel , Inbound Marketing และการยิงแอดโฆษณา ตลอดจนสามารถใช้งาน Martech ต่าง ๆ ได้เป็นอย่างดี เพื่อสนับสนุนการทำ Data Driven Marketing ให้กับองค์กรที่สังกัดอยู่ได้

รู้จักกับ Data Driven Marketing อ่านต่อที่: Data-Driven Marketing กลยุทธ์ขับเคลื่อนธุรกิจด้วยข้อมูล

Soft Skill ของ Data Scientist มีอะไรบ้าง 

Soft Skill ก็สำคัญกับการทำงาน Data Science เช่นเดียวกัน ดังนั้น ผู้ที่รับหน้าที่ Data Scientist จึงต้องเป็นคนที่มีทั้งทักษะในการจัดการกับข้อมูล ควบคู่ไปกับทักษะเรื่องการสื่อสาร การสรุปความ การมองเห็นภาพรวมในเรื่องต่าง ๆ และสามารถอธิบายสถานการณ์โดยรวมได้ เพราะ Data Scientist คือ ผู้ที่จะต้อง “ทำเรื่องยากให้เป็นเรื่องง่าย” 

Data Scientist เงินเดือนอยู่ระหว่างเท่าไหร่ 

สำหรับในประเทศไทย เงินเดือนของสายงาน Data Science ปี 2021 เฉลี่ยจะเริ่มต้นที่ 30,000-50,000 บาท และเงินสามารถขึ้นไปสูงสุดอยู่ที่ 150,000 บาทได้เลยทีเดียว

3 ทักษะสำคัญต่อการทำงานด้าน Data Science

สำหรับคนที่กำลังสนใจศาสตร์ของการทำ Data Science นี่คือ 3 ทักษะที่จำเป็นต่อการทำ Data Science ให้มีประสิทธิภาพ ซึ่งสามารถแบ่งออกได้เป็น 3 ด้าน ดังนี้

ทักษะของ Data Science

ที่มาภาพ : https://edvancer.in/8-data-science-skills/

ทักษะ Data Science 1 : Hacking Skills

Hacking Skills หมายถึง ทักษะในการใช้เทคโนโลยีและเทคนิคเพื่อทำงานในด้านต่าง ๆ อาทิ การจัดการงาน Data Science ด้วย Python Data Science, การเขียนโปรแกรมด้วยภาษา Python หรือ ภาษา R, การจัดการฐานข้อมูลโดยใช้ MySQL, การสร้างรายงาน และแสดงผลข้อมูล (visualization) โดยใช้เครื่องมือ เช่น D3 Tableau, Qlikview หรือ R Markdown, การใช้เทคโนโลยี เพื่อจัดการกับ Big Data เช่น Hadoop, MapReduce หรือ Spark เป็นต้น

ทักษะ Data Science 2 : Math & Statistics Knowledge

Math & Statistics Knowledge หมายถึง ทักษะที่เกี่ยวข้องกับด้านคณิตศาสตร์และทางสถิติ โดยการเลือกใช้แบบจำลองในการวิเคราะห์และตีความผลลัพธ์ด้านคณิตศาสตร์และสถิติมาช่วยในการทำ Data Science  เช่น การเรียนรู้ด้วยเครื่อง (Machine Learning) การทำเหมืองข้อมูล (Data Mining) และพีชคณิต (Algebra) เป็นต้น ทั้งนี้ Data Scientist คือ ผู้ที่ต้องรับหน้าที่วิเคราะห์และประมวลผลข้อมูล ซึ่งส่วนมากจะเกี่ยวข้องกับการคำนวณ และถึงแม้ว่าในปัจจุบันจะมีเครื่องมือที่สามารถทำทุกอย่างแทนได้ แต่ Data Scientist ก็จำเป็นต้องเชี่ยวชาญในพื้นฐานเหล่านี้อยู่

ทักษะ Data Science 3 : Substantive Expertise 

Substantive Expertise หมายถึง ความรู้ความเชี่ยวชาญเฉพาะด้าน (Domain Knowledge) ซึ่งจะช่วยให้ Data Scientist เข้าใจเกี่ยวกับวัตถุประสงค์ ขอบเขต และเป้าหมายของงานมากขึ้น เนื่องจากการตั้งคำถามที่ดีต้องอาศัยความเข้าใจในเรื่องนั้นจริง ๆ 

นอกจากนี้ Substantive Expertise ยังนับรวมไปถึงทักษะด้านการนำเสนอและสื่อสาร ที่ช่วยสร้างความเข้าใจในกลุ่มของเพื่อนร่วมงานและผู้บริหาร เพื่อแสดงให้รู้ว่ามีปัญหาเกิดขึ้นที่จุดใด กำลังจะทำสิ่งใด และมีประโยชน์อย่างไรอีกด้วย

อย่างไรก็ดี การที่จะหา Data Scientist ที่เก่งทั้งหมดทั้ง 3 ด้านอาจเป็นเรื่องยาก องค์กรส่วนใหญ่จึงเลือกจัดตั้งเป็น ‘ทีม Data Science’ ที่ประกอบด้วยคนที่เก่งแต่ละด้านมาอยู่ในทีมเดียวกัน ทำให้สามารถแบ่งงานสาย Data Science ได้เป็นอีกหลายตำแหน่งเลยทีเดียว

วงจรของ Data Science 

วงจรของการทำ Data Science หรือ Data Science Life Cycle คือ ลำดับของกระบวนการจัดการข้อมูล ตั้งแต่ตอนเก็บรวบรวม วิเคราะห์ ประมวลผล และนำไปใช้ จนถึงตอนเริ่มเก็บข้อมูลใหม่อีกครั้ง ซึ่งจะมีอยู่ด้วยกัน 5 ข้อ ดังนี้

วงจรของ Data Science

  1. Capture การจับข้อมูล: วงจร Data Science เริ่มต้น ด้วยการจับข้อมูล เพื่อนำไปใช้ในระบบคอมพิวเตอร์ด้วยวิธีการต่าง ๆ เช่น การรวบรวมข้อมูล (Data Acquisition), การป้อนข้อมูล (Data Entry), การดึงข้อมูล (Data Extraction) โดยจะรวบรวมทุกข้อมูลดิบ ทั้งที่มีโครงสร้าง (Structured Data) หรือ ข้อมูลที่มีการจัดเก็บไว้ในรูปแบบหรือโครงสร้างชัดเจน เช่น ข้อมูลที่อยู่ในรูปของไฟล์ CSV หรือไฟล์ Excel และข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data) เช่น ข้อมูลในรูปแบบของรูปภาพ คลิปวิดีโอ ไฟล์เสียง รวมถึงข้อความบนโลกออนไลน์จากการทำ Social Media Marketing และข้อมูลที่ได้จากการกรอก Lead ของลูกค้า เป็นต้น

Lead คืออะไร อ่านเพิ่มเติมได้ที่: Lead คืออะไร ทำไมธุรกิจควรมี Lead Generation Strategies

 

  1. Maintain การบำรุงรักษา: ข้อมูลที่ผ่านการ Capture มาได้ อาจสูญหายไปตามการเวลา หากไม่ได้ผ่านการบำรุงรักษาข้อมูล ดังนั้น วงจรต่อไปของการทำ Data Science จึงเป็นการรักษาสภาพข้อมูลด้วยวิธีการต่าง ๆ เช่น การทำระบบคลังข้อมูล (Data Warehousing System) เพื่อรวบรวม จัดเก็บข้อมูล หรือการทำความสะอาดข้อมูล (Data Cleansing) ด้วยการตรวจสอบ แก้ไข หรือการลบ เพื่อให้รายการข้อมูลที่ไม่ถูกต้องออกไปจากชุดข้อมูล ตลอดจนการทำสถาปัตยกรรมข้อมูล (Data Architecture) ที่เป็นแผนผังสำหรับกำหนดมาตรฐานในการรวบรวมข้อมูล จัดเก็บ จัดการ ประมวลและวิเคราะห์ข้อมูล เพื่อให้เข้าถึงข้อมูลได้รวดเร็ว ฯลฯ
  1. Process การจัดการข้อมูล: กระบวนการที่เป็นหัวใจสำคัญของการทำ Data Science ก็คือการจัดการกับข้อมูลจำนวนมหาศาลให้อยู่ในรูปของข้อมูลที่ต้องการ รวมถึงวิเคราะห์ด้วยว่าข้อมูลนั้นจะมีประโยชน์เพียงใดในการวิเคราะห์เชิงคาดการณ์ เช่น การทําเหมืองข้อมูล (Data Mining) การทำแบบจำลองข้อมูล หรือแนวคิดที่ใช้อธิบายโครงสร้าง ความสัมพันธ์ และความหมายของข้อมูล (Data Modeling) และการสรุปข้อมูล (Data Summarization) เป็นต้น 
  1. Analyze การวิเคราะห์ข้อมูล: Data Science คือ วิทยาการข้อมูล ดังนั้น จึงต้องผ่านกระบวนการวิเคราะห์ข้อมูลด้วยวิธีการทางวิทยาศาสตร์ เช่น การวิเคราะห์องค์ประกอบเชิงสำรวจ (Exploratory Factor Analysis) การวิเคราะห์องค์ประกอบเชิงยืนยัน (Confirmatory Factor Analysis) การวิเคราะห์เชิงทำนาย (Predictive Analysis) และการวิเคราะห์การถดถอย (Regression Analysis) เป็นต้น
  1. Communicate การนำเสนอข้อมูล: วงจรสุดท้ายของ Data Science Life Cycle คือ การเตรียมนำเสนอข้อมูลที่ได้จากการทำ Data Science ในรูปแบบที่อ่านง่าย เช่น แผนภูมิ กราฟ รายงาน ฯลฯ

ขั้นตอนของ Data Science Process

Data Science Process คือ กระบวนการวิทยาการข้อมูล ซึ่งมีขั้นตอนที่ต้องอาศัยความเชี่ยวชาญของนักวิเคราะห์ข้อมูลอยู่ไม่น้อย และในหัวข้อนี้ เราจะมาเรียนรู้กันว่า Data Science Process มีกี่ขั้นตอน แต่ละขั้นตอนทำงานอย่างไร และที่สำคัญวิทยาการข้อมูลสำหรับธุรกิจ หรือ Data Science for Business คืออะไร และทุกธุรกิจควรนำมาไปปรับใช้อย่างไร

ขั้นตอนของ Data Science Process OSEMN

ที่มาภาพ: https://towardsdatascience.com/

CRISP-DM (Cross Industry Standard Process for Data Mining)

CRISP-DM (Cross Industry Standard Process for Data Mining) เป็นขั้นตอนในการทำ Data Science ที่นิยมใช้ในการวิเคราะห์ข้อมูลด้วย Data Mining ซึ่งสัมพันธ์กับ Data Science for Business หรือ การทำ Data Science เพื่อเป้าหมายทางธุรกิจ สามารถแบ่งออกได้เป็น 6 ขั้นตอน ได้แก่ 

  • การทำความเข้าใจธุรกิจ (Business Understanding) 

ขั้นตอนแรกในกระบวนการ CRISP-DM คือ การทำความเข้าใจในธุรกิจหรือสิ่งที่กำลังจะเข้าไปวิเคราะห์ โดยศึกษา หาปัญหา และกำหนดวัตถุประสงค์ของธุรกิจด้วยเมตริกที่เหมาะสม เช่น การทำ SWOT การหาว่า Customer Journey คืออะไร รู้ว่า ภาพจำด้าน Branding ของธุรกิจคืออะไร ฯลฯ ก่อนจะวางแผนสิ่งที่จะต้องทำต่อในเบื้องต้น นอกจากนี้ Data Scientist อาจต้องวิจัยเพิ่มเติมถึงกรณีศึกษาของปัญหาว่า ธุรกิจคู่แข่งอื่น ๆ มีวิธีแก้ปัญหาที่คล้ายคลึงกันนี้อย่างไร แล้วจึงนำมาใช้ในการกำหนดแผนที่จะทำต่อไปด้วย

>> อ่านเพิ่มเติม: SWOT คืออะไร

  • การทำความเข้าใจข้อมูล (Data Understanding)

เมื่อกำหนดโจทย์ในการทำ Data Science เรียบร้อยแล้ว ก็ต้องทำความเข้าใจข้อมูลว่า ตอนนี้ธุรกิจมีข้อมูลอะไรบ้าง ก่อนจะรวบรวมข้อมูลเพิ่มเติม ตรวจสอบข้อมูล และทำความเข้าใจข้อมูลทั้งหมดว่ามีคุณภาพมากน้อยแค่ไหน หากยังไม่มากพอก็ต้องรวบรวมข้อมูลต่อไป จนกว่าจะได้ข้อมูลที่ดีและมากพอต่อไป

  • การเตรียมข้อมูล (Data Preparation) 

ขั้นตอนที่ใช้เวลานานที่สุดในการทำ Data Science คือ การทบทวนข้อมูลที่ได้จากแหล่งต่าง ๆ ด้วยกระบวนการวิจัยข้อมูลที่หลากหลาย เพื่อนำไปสู่การออกแบบงานวิจัยออกมาในรูปแบบต่าง ๆ ตามที่ต้องการ เช่น 

  • การล้างข้อมูล (Data Cleaning): การแก้ไขข้อมูลที่ไม่สมบูรณ์หรือผิดพลาด 
  • การรวมข้อมูล (Data integration): การรวมข้อมูลจากแหล่งต่าง ๆ 
  • การแปลงข้อมูล (Data Transformation): การจัดรูปแบบข้อมูล 
  • การลดข้อมูล (Data Reduction): การลดข้อมูลให้อยู่ในรูปแบบที่ง่ายที่สุด 
  • การแยกข้อมูล (Data Discretization): ลดจำนวนค่าเพื่อให้จัดการข้อมูลง่ายขึ้น 
  • วิศวกรรมคุณลักษณะ (Feature Engineering): กระบวนการแปลงข้อมูลให้อยู่ในรูปแบบที่สามารถนำไปใช้งานได้ใน Machine Learning
  • การสร้างโมเดล (Modeling)

เลือกและทดสอบสร้างโมเดลหรือแบบจำลองข้อมูลหลาย ๆ แบบ ที่คิดว่าสามารถแก้ปัญหาที่ต้องการได้ จากนั้นจึงค่อย ๆ ปรับค่าพารามิเตอร์ของแต่ละโมเดล เพื่อให้ได้ค่าที่เหมาะสมที่สุดในการแก้ปัญหา แต่ถ้าพบว่ายังไม่ได้โมเดลที่น่าพอใจก็จะต้องย้อนกลับไปเตรียมข้อมูลใหม่อีกครั้ง

  • การวัดประสิทธิภาพของโมเดล (Evaluation) 

หัวใจสำคัญของการทำ Data Science เพื่อเป้าหมายทางธุรกิจ หรือ Data Science for Business คือ การวัดประสิทธิภาพของโมเดล โดย Data Scientist จะทำหน้าที่ในการตรวจสอบกระบวนการทำงาน และอธิบายว่าโมเดลจะสามารถช่วยธุรกิจได้อย่างไร พร้อมสรุปสิ่งที่ค้นพบและแก้ไขให้เรียบร้อย สุดท้ายจะเป็นการประเมินว่าโมเดลนี้พร้อมที่จะนำไปใช้งานหรือไม่ หรือจำเป็นที่จะต้องทำการวิจัยข้อมูลใหม่อีกครั้ง

  • การนำโมเดลไปใช้งานจริง (Deployment)

ขั้นตอนสุดท้ายของการทำ Data Science แบบ CRISP-DM ก็คือการนำโมเดลไปใช้งานจริง อย่างไรก็ดี การทำ Data Science อาจไม่ได้สิ้นสุดที่ขั้นตอนนี้ เนื่องจากในระหว่างที่มีการปรับใช้โมเดล จะต้องทำเอกสารเพื่อบอกว่า ตั้งใจจะปรับใช้โมเดลอย่างไร รวมถึงวิธีส่งมอบและนำเสนอผลลัพธ์อย่างไร หลังจากนั้นจะต้องดูแลรักษาโมเดลในระหว่างของการนำไปใช้เรื่อย ๆ ตลอดจนทำรายงานสรุปว่า กระบวนการทั้งหมดที่ผ่านมานั้นมีสิ่งใดใช้ได้ผลและสิ่งใดที่ต้องปรับปรุงบ้าง

OSEMN 

OSEMN คือ 5 ขั้นตอนการทำงานด้าน Data Science ประกอบด้วย

  • Obtain Data (การเก็บข้อมูล)

Obtain Data สำคัญอย่างยิ่งกับการทำ Data Science เพราะเป็นขั้นตอนของการเก็บข้อมูล รับข้อมูล และการดึงข้อมูลจากฐานข้อมูลที่มีอยู่ โดยสามารถใช้เครื่องมือหลากหลายอย่างในขั้นตอนนี้ได้ เช่น API หรือ SQL, Big Data, การทำ Web Scraping เป็นต้น

  • Scrub Data (การทำความสะอาดข้อมูล)

การทำความสะอาดข้อมูล หรือ Data Wrangling จะเป็นกระบวนการเปลี่ยนข้อมูลดิบให้อยู่ในรูปแบบที่ง่ายต่อการใช้งาน สามารถทำได้หลายวิธีโดยขึ้นอยู่กับลักษณะข้อมูล และเป้าหมายในการใช้งาน เรียกได้ว่าเป็นขั้นตอนที่สำคัญที่สุดของการทำ Data Science ในรูปแบบ OSEMN เลยก็ว่าได้

  • Explore Data (การค้นหาข้อมูลที่สนใจ)

Explore Data คือ การสำรวจและค้นหาข้อมูลเพื่อหาความสัมพันธ์ แนวโน้ม หรือสิ่งที่น่าสนใจที่เกี่ยวข้องกัน โดยใช้วิธีการต่าง ๆ ที่เกี่ยวข้องกับการทำ Data Science ตัวอย่างเช่น การใช้ Command Line Tools หรือคำสั่งที่ใช้ในการจัดการหรือปรับแต่งค่าต่าง ๆ ของข้อมูล การใช้ R และการใช้ Python เป็นต้น หลังจากนั้นนำมาแสดงผล (Visualize) ข้อมูลให้เห็นภาพมากขึ้น

  • Model Data (การสร้างโมเดลข้อมูล)

การจำลองข้อมูลโดยการสร้างโมเดลด้วยการใช้ซอฟต์แวร์และอัลกอริทึม Machine learning มาใช้เพื่อดึงข้อมูล คาดการณ์ผลลัพธ์ และกำหนดแนวทางปฏิบัติที่ดีที่สุด แล้วทำการประเมินความถูกต้องของผลลัพธ์ รวมถึงทำการปรับแต่งแบบจำลองข้อมูล เพื่อปรับปรุงผลของการทำ Data Science ให้เป็นไปตามที่ต้องการ

  • Interpret Results (การแปลงข้อมูลและนำเสนอ)

การทำ Data Science แบบ OSEMN ขั้นตอนสุดท้าย คือ การแปลงข้อมูลแล้วนำออกมาเล่าเป็นเรื่องราวเพื่อนำเสนอ โดยอาจจะสร้างเป็นไดอะแกรม กราฟ และแผนภูมิ เพื่อแสดงแนวโน้มและการคาดการณ์ต่าง ๆ ซึ่งการสรุปข้อมูลนี้จะช่วยให้เจ้าของธุรกิจเข้าใจและนำผลลัพธ์ไปใช้อย่างมีประสิทธิภาพมากขึ้น

คำถามที่พบบ่อย

1. Data Analytics vs. Data Science แตกต่างกันไหม? 

เรามักจะได้ยิน Data Analytics และ Data Science อยู่บ่อย ๆ แต่อาจจะไม่ทราบว่า 2 คำนี้แตกต่างกันอย่างไร มาทำความเข้าใจว่า Data Science vs Data Analytics คืออะไร ไปพร้อมกันเลยดีกว่า

Data Analytics คือ การวิเคราะห์ข้อมูลที่มีอยู่ตั้งแต่ อดีต จนถึงปัจจุบัน เพื่อช่วยให้ธุรกิจบรรลุวัตถุประสงค์ที่ต้องการ ผ่านการใช้สถิติและตัวเลขในการคาดคะเนพฤติกรรมผู้บริโภค รวมถึงนักวิเคราะห์ข้อมูลจะทำการคิดค้นวิธีการดึงข้อมูล นำมาใช้ และจัดระบบชุดข้อมูลใหม่ เพื่อหาวิธีการแก้ปัญหาที่ดีที่สุดให้กับธุรกิจ และสามารถนำมาใช้ในการหาคำตอบในคำถามใดคำถามหนึ่ง หรือใช้เพื่อประโยชน์ในการอำนวยความสะดวกให้การทำงานในตำแหน่งใดตำแหน่งหนึ่ง เช่น การทำ CRM Data Maintenance หรือการทำ A/B Testing เป็นต้น

อ่านเพิ่มเติม: CRM คืออะไร

ส่วน Data Science จะเป็นศาสตร์ที่รวบรวมหลายแขนงวิชาเข้าด้วยกัน เน้นการค้นหาข้อมูลเชิงลึกภาพใหญ่ ทั้งจากชุดข้อมูลดิบและข้อมูลที่ผ่านการจัดระบบแล้ว รวมถึงมักจะใช้กับการติดตามเทรนด์และคาดคะเนอนาคตมากกว่า จึงเป็นการทำความเข้าใจข้อมูลในมุมมองที่กว้างกว่าการทำ Data Analytics ทั้งนี้ การทำ Data Science ไม่ได้มุ่งเน้นหาคำตอบของคำถามใดคำถามหนึ่งเหมือนที่ Data Analytics ทำ แต่มักจะวิเคราะห์ผ่านชุดข้อมูลขนาดใหญ่เพื่อให้ได้มาซึ่งคำตอบที่ต้องการเท่านั้น

2. ตำแหน่งใดบ้างที่เกี่ยวข้องกับ Data Scientist?

  • Business Managers: เป็นผู้ที่จะต้องทำงานร่วมกันกับทีม Data Scientist เพื่อกำหนดปัญหาและพัฒนากลยุทธ์สำหรับการวิเคราะห์ข้อมูล โดยมักเป็นหัวหน้าทีมด้านการพัฒนาเป็นด้านธุรกิจในแผนกต่าง ๆ เช่น แผนกการตลาด การเงิน หรือการขาย เป็นต้น โดยทีม Data Scientist จะต้องเป็นผู้รายงานผลการทำงานให้ Business Managers ทราบถึงข้อมูลที่ช่วยพัฒนาธุรกิจหรือผลิตภัณฑ์เป็นหลัก
  • IT Managers: มีหน้าที่สนับสนุนการดำเนินงานในการทำ Data Science ให้ลุล่วงด้วยการสร้างและปรับปรุงเครื่องมือที่ใช้ให้เหมาะสมสำหรับขั้นตอนต่าง ๆ ในการทำ Data Science เช่น เลือกเทคโนโลยีการเก็บข้อมูลภายใน สร้าง Database พัฒนาโครงสร้างพื้นฐานข้อมูล เป็นต้น
  • Data Science Managers: เป็นผู้ที่ทำหน้าที่ดูแลทีม Data Science และงานต่าง ๆ ให้สำเร็จตามกำหนด เรียกได้ว่าเป็น ผู้สร้างทีม และช่วยสร้างสมดุลระหว่างการพัฒนาทีมกับการวางแผนและทีมที่จะต้องติดตามการทำงานในแผนกอื่น ๆ อีกด้วย

ข้อสรุปของ Data Science

Data Science เป็นศาสตร์ที่เรียกได้ว่ากำลังมาแรง และมีส่วนช่วยพัฒนาธุรกิจและโลกของเราให้ขับเคลื่อนไปข้างหน้า ซึ่งในอนาคตก็จะมีบทบทบาทกับมนุษย์อย่างเรา ๆ ได้มากขึ้นอีกหลายเท่าจากการพัฒนาเทคโนโลยีทั้งในโลกแห่งความจริงและโลกเสมือน (Metaverse) โดยเฉพาะใน Tech Company ต่าง ๆ ที่เก็บข้อมูลเอาไว้จำนวนมหาศาล ไม่เพียงเท่านี้ ในแวดวงธุรกิจออนไลน์เองก็นำศาสตร์ Data Science มาช่วยในการพัฒนากลยุทธ์การตลาด ทำให้องค์กรมีข้อมูลแน่ชัดเรื่อง Target Audience และความต้องการของลูกค้า ซึ่งนำไปสู่การสร้างสรรค์คอนเทนต์ที่ตอบโจทย์ และการคิด CTR ที่สามารถดึงดูดลูกค้าได้ เพื่อให้ธุรกิจบรรลุเป้าหมายเรื่องยอดขาย และสามารถเติบโตไปข้างหน้าได้อย่างแท้จริง

อ่านเพิ่มเติม: Metaverse คืออะไร

เอกสารอ้างอิง

What is Data Science?. (n.d.). [ออนไลน์]. ได้จาก: https://www.oracle.com/th/what-is-data-science/
Avijeet Biswal.  (2022).  What is Data Science: Lifecycle, Applications, Prerequisites and Tools.  [Online]. retrieve from: https://www.simplilearn.com/tutorials/data-science-tutorial/what-is-data-science#the_data_science_lifecycle
Sakshi Gupta.  (2022).  Data Science Process: A Beginner’s Guide in Plain English.  [Online]. retrieve from: https://www.springboard.com/blog/data-science/data-science-process/#h2
Connext Team.  (2022).  Data Analytics VS Data Science แตกต่างกันไหม ? และเส้นทางไหนเหมาะกับความเป็นคุณ. [ออนไลน์]. ได้จาก: https://techsauce.co/connext/career-insight/how-is-different-between-data-analytics-and-data-science

AI Deepfake
AI Marketing
AI Deepfake คืออะไร? ทำไมต้องระวัง เกี่ยวข้องกับมิจฉาชีพอย่างไร

มิจฉาชีพเกิดขึ้นใหม่รายวัน และมักใช้เทคโนโลยีใหม่ ๆ พัฒนากลโกง ให้ไปถึงจุดที่ภาครัฐยากจะจัดการได้ หนึ่งในคือเทคโนโลยี AI Deepfake หรือ เทคโนโลยีปลอมแปลงใบหน้า ที่เป็นข่าวรายวันในช่วง 1…

การตลาดสายเทา
Marketing
การตลาดสายเทาคืออะไร ต่างกับการตลาดสายขาวอย่างไร นักการตลาดต้องรู้!

สำหรับคนที่คลุกคลีกับวงการ Marketing มาสักพัก โดยเฉพาะนักการตลาดที่เน้นทำ SEO เป็นหลัก น่าจะเคยได้ยินคำ 2 คำที่พันผูกกับวงการ SEO มาช้านาน นั่นคือ…

KOL Management ต้องอ่าน! รวม KPI ของงานจ้างอินฟลูที่คุณต้องรู้
Marketing
KOL Management ต้องอ่าน! รวม KPI ของงานจ้างอินฟลูที่คุณต้องรู้

ดังที่บุคลากรสายการตลาดทราบกันดีว่า Influencer Marketing คือหนึ่งในเทคนิคการตลาดยอดนิยมแห่งยุค เนื่องจากความนิยมของคอนเทนต์ประเภทคลิปวิดีโอสั้น และวัฒนธรรมการเสพวิถีชีวิตของคนมีชื่อเสียง จึงทำให้ในช่วง 3 – 4 ปีมานี้มีสายงานใหม่ถือกำเนิดขึ้น นั่นคือ…