เมื่อใช้ AI จัดการ Big data สำรวจตลาดงานไทย

มากกว่า 5 ปี ที่ทีมวิจัย Big Data สถาบันวิจัยเพื่อการพัฒนาประเทศไทย หรือ ทีดีอาร์ไอ ติดตาม เก็บรวบรวมข้อมูลประกาศหางานจาก 14 เว็บไซต์หางานในประเทศไทยต่อเนื่อง โดยใช้เครื่องมืออย่าง ปัญญาประดิษฐ์ หรือ เอไอ มาช่วยรวบรวม จำแนก และวิเคราะห์ จนได้ภาพสะท้อนความต้องการจ้างงานที่ทันต่อความเปลี่ยนแปลงในตลาดแรงงานไทย

ปีที่ผ่านมาเว็บประกาศรับสมัครงาน มีประกาศรับสมัครงานประมาณ 6-7 แสนตำแหน่ง ซึ่งข้อมูลขนาดใหญ่ ทำให้นักวิจัยมองเห็นแนวโน้มความต้องการคุณวุฒิ ทักษะแรงงานไปจนถึงการกระจุกตัวของงานในบางพื้นที่ และอาชีพใหม่ๆในตลาดแรงงาน ซึ่งเป็นสัญญาณบ่งบอกว่าต่อไปอาชีพอะไรจะ “รุ่ง” อาชีพใดจะ “ร่วง”

ทีมวิจัย Big Data มองเห็นว่าข้อมูลนี้นอกจากจะเป็นประโยชน์ต่อการวิเคราะห์ความต้องการของนายจ้างแล้วยังเป็นประโยชน์ต่อผู้ที่กำลังจะเข้าสู่ตลาดแรงงาน หรือแม้แต่การปรับปรุงหลักสูตรของมหาวิทยาลัยและสถาบันอาชีวะศึกษาที่ผลิตบุคลากรป้อนตลาดแรงงาน

ท่ามกลางข้อมูลขนาดใหญ่นี้ คุณวินิทร เธียรวณิชพันธุ์ และ ดร.ทศพล ป้อมสุวรรณ สองนักวิจัย จากทีมวิจัย Big Data สถาบันวิจัยเพื่อการพัฒนาประเทศไทย ทีดีอาร์ไอ ได้เล่าสรุปข้อค้นพบผ่านบทสัมภาษณ์ “เมื่อใช้ AI จัดการ Big data สำรวจตลาดงานไทย” ซึ่งข้อค้นพบที่เกิดขึ้นอาจช่วยให้คำตอบแก่ผู้กำหนดนโยบายด้านการศึกษาไทยและด้านแรงงาน ว่าหลักสูตรการศึกษากำลังผลิตคนที่ตรงความต้องการนายจ้างหรือไม่ รวมทั้ง การสนับสนุนการพัฒนาทักษะของแรงงานควรมุ่งไปทางไหน รวมทั้งผู้คนทั่วไปหากจะ Up-skill Re-Skill ควรเลือกเติมทักษะ ความรู้อะไร

Q: ทำไมเราถึงต้องใช้เอไอในการวิเคราะห์ภาพรวมการจ้างงานในไทย

เมื่อก่อนเวลาที่เราพูดถึงข้อมูลการรับสมัครงาน จะใช้ข้อมูลจากภาครัฐ ซึ่งข้อมูลรับสมัครงานส่วนใหญ่คือข้อมูลที่เก็บโดยสำนักงานสถิติแห่งชาติ ที่มาจากการสุ่มประชากรทางสถิติ โดยจะสุ่มตัวอย่างมาจำนวนหนึ่งที่จะถูกใช้เป็นตัวแทนของประชากรทั้งหมด ซึ่งการเก็บข้อมูลในลักษณะนี้ ทำให้เราไม่พบอาชีพแปลกๆใหม่ๆที่เพิ่งเกิดขึ้น ซึ่งอาจยังมีน้อยแต่มีความสำคัญและอาจมีมากขึ้นในอนาคต เพราะการสุ่มทำให้ไม่เจอ

ลองนึกภาพว่า Chat GPT ที่เพิ่งเริ่มเป็นที่รู้จักกว้างขว้างขึ้นในปีนี้ ทำให้เกิดความต้องการอาชีพ หรือตำแหน่งที่เรียกว่า Prompt Engineer เกิดขึ้น ซึ่งการเก็บข้อมูลแบบเดิม โดยการสุ่มจะไม่เจอ แต่การใช้เอไอจะแก้ไขปัญหานี้ และตอบโจทย์สะท้อนภาพความจริงที่ทันต่อความเปลี่ยนแปลงของตลาดจ้างงานมากกว่า อย่างน้อยเราเห็นฐานข้อมูลจำนวนหนึ่งที่น่าจะมากพอ เพราะไม่ใช่การสุ่ม เมื่อเก็บข้อมูลด้วยวิธีนี้ก็ทำให้เราเจอจริงๆ ว่ามีอาชีพไหน ที่เป็นเทรนด์ใหม่ๆบ้าง

นอกจากแก้ปัญหาเรื่องตัวแทนข้อมูลซึ่งไม่ครอบคลุมและไม่สะท้อนความจริงแล้ว เอไอยังตอบโจทย์เรื่องทุ่นแรงมนุษย์ หรือทุ่นแรงงานในการอ่านข้อมูลจำนวนมาก โดยปกติการจำแนกความต้องการอาชีพต่างๆ จะต้องอาศัยคนมาช่วยอ่านและจำแนก ถึงแม้จะเป็นคนที่มีความเข้าใจในเรื่องการจำแนกกลุ่มงานก็ตาม ก็อาจมีความผิดพลาดเกิดขึ้นได้ เพราะงานหลายตำแหน่งมีการแบ่งประเภทกลุ่มงานที่หลากหลาย อย่างด้านไอที มีการจำแนกกลุ่มงานออกเป็น 9-10 ด้าน จึงต้องใช้คนที่มีความเข้าใจมานั่งอ่านประกาศกันทั้งวัน สมมุติวันละ 8 ชั่วโมง คนที่อ่านเร็วๆวันหนึ่งอ่านได้แค่ 1,000 โพสต์งานเท่านั้น ดังนั้นกำลังคนจะไม่เพียงพอ ไม่สามารถที่จะรับมือกับปริมาณข้อมูลที่เข้ามาได้ทันท่วงที

แต่การเก็บข้อมูลด้วยเอไอก็ต้องออกแรงฝึกฝนเอไอด้วยการสร้างโมเดล แล้วให้เอไอใช้โมเดลที่เราสร้างขึ้นในการจำแนกประกาศรับสมัครงาน และเมื่อเอไอเรียนรู้เข้าใจความต้องการเราแล้วในแต่ละวันพอข้อมูลเข้ามาปุ๊บ โปรแกรมก็จะสามารถจำแนกได้จบภายในหนึ่งวัน โดยที่เราไม่ต้องไปเสียเวลาอ่านอีกแล้ว หรืออย่างมากคือการตรวจเช็คความแม่นยำ สุ่มเช็คว่าผลของการจำแนกของโมเดลนั้นมีแม่นยำหรือไม่ ก็ลดเวลาไปได้เยอะมาก ซึ่งถ้าเทียบกับวิธีการเก็บข้อมูลแบบเดิมจะเห็นว่าแบบนี้จะมีความแม่นยำ รวมไปถึงสามารถแสดงผลข้อมูลครอบคลุมระดับประเทศ ไปจนถึงแยกรายละเอียดสำคัญๆอื่นๆของความต้องการแรงงานได้

Q: ข้อมูลประกาศรับสมัครงานที่เราเก็บมาประมวลผล ประกอบไปด้วยอะไรบ้าง

จุดเริ่มต้นเรามุ่งเก็บข้อมูลประกาศรับสมัครงานกลุ่มอาชีพสาย STEM (Science, technology, engineering, and mathematics) เพราะโครงการนี้ตั้งต้นในช่วงที่ประเทศไทยเริ่มมีนโยบายไทยแลนด์ 4.0 ที่ภาคการศึกษามุ่งผลิตคนสายงานด้าน STEM แต่การทำโครงการนี้ก็ทำให้เราเห็นความต้องการแรงงานในกลุ่มอื่นๆด้วย ดังนั้นต่อมาเราจึงเก็บทุกอาชีพที่ปรากฎและประมวลผลทั้งหมด ส่วนข้อมูลที่เป็นองค์ประกอบในการประกาศรับสมัครงาน เราเก็บทั้งชื่อตำแหน่งงาน สถานที่ทำงาน ชื่อบริษัท ซึ่งชื่อบริษัทเราก็สามารถไปดูต่อได้ว่า เป็นบริษัททำด้านไหน วุฒิการศึกษาขั้นต่ำและเงินเดือน ซึ่งบางเว็บก็ใส่บ้างไม่ใส่บ้าง ยังมีคุณสมบัติ ประสบการณ์การทำงาน ทักษะต่างๆ หน้าที่งานทำอะไรบ้าง ข้อมูลสวัสดิการ

เราพยายามเก็บทุกอย่างเท่าที่จะเก็บได้ และจัดหมวดหมู่ แต่ธรรมชาติแต่ละเว็บไซต์เก็บไม่เหมือนกัน อย่างชื่อตำแหน่ง วุฒิการศึกษา เก็บและจำแนกได้เลย แต่ถ้าเป็นการอธิบายรายละเอียดต่างๆ บางครั้งเราเก็บมาก่อนทั้งก้อน แล้วค่อยมาหาทางประมวลผลภายหลัง อย่างทักษะต่างๆ นายจ้างจะเขียนอธิบายเป็นคำยาวๆ เราก็ต้องอาศัยคนมาแยกต่อ คล้ายกับทำดิกชันนารี เช่น ทักษะการเขียนโปรแกรมได้ ต้องไปดูว่า เขียนภาษาไพทอน (Python) หรือ เขียนภาษาจาวา (Java) เราก็ต้องมีกระบวนการ พอเก็บมาแล้ว ก็มีกระบวนการต่อ

Q: เป้าหมายของการเก็บรวบรวมและวิเคราะห์นี้นำไปสู่อะไร

แน่นอนว่าเราวิเคราะห์สถานะความต้องการแรงงาน เพื่อทราบว่าทักษะแบบไหนที่นายจ้างต้องการ ซึ่งความต้องการของนายจ้างเปลี่ยนแปลงไปอย่างรวดเร็วตามเศรษฐกิจที่เปลี่ยนแปลง รวมทั้งเทคโนโลยีที่พัฒนาไม่หยุดยั้ง และคาดหวังว่าจะเป็นประโยชน์ต่อผู้ที่กำลังจะเข้าสู่ตลาดแรงงาน รวมทั้งการปฏิรูปการศึกษา ปรับปรุงหลักสูตรการเรียนการสอนในระดับมหาวิทยาลัยและอาชีวศึกษา ที่จะต้องผลิตคนเข้าสู่ตลาดแรงงาน ผลลัพธ์ที่เป็นรูปธรรมคือ ที่ผ่านมาในช่วงการแพร่ระบาดของโควิด-19 ซึ่งมีอัตราการว่างงานสูงที่สุดในรอบ 20 ปี ซึ่งข้อมูลในส่วนนี้ก็เป็นประโยชน์ต่อการออกแบบนโยบายการช่วยเหลือต่างๆ

Q : ภาพรวมข้อมูลได้บอกอะไรเราเกี่ยวกับความต้องการแรงงานในตลาดแรงงานไทย

ภาพรวมที่เห็นชัดคือยืนยันว่าหลายอาชีพ คนจบใหม่ในยุคนี้ต้องมีความพร้อมด้านทักษะพื้นฐานที่เปลี่ยนไป เช่น ทักษะภาษาอังกฤษที่ไม่ถูกระบุในสายงานบางกลุ่มแล้ว ซึ่งไม่ได้หมายความไม่ต้องการ แต่กลับเป็นทักษะจำเป็นที่คุณต้องมี รวมไปถึงงานด้านการตลาดที่เราพบว่ามีการประกาศรับสมัครจำนวนมากที่สุด เห็นเลยว่าคุณต้องมีความรู้ ความเข้าใจโซเชียลมีเดีย ไม่ใช่เพียงใช้งานได้ ใช้งานเป็น อย่างน้อยๆต้องเข้าใจเรื่องที่เกี่ยวกับอัลกอริทึมของโซเชียลมีเดีย ความรู้นี้จะเป็นแต้มต่อให้คนสมัครงาน

และด้วยโครงการของเรามุ่งเน้นติดตามงานด้านไอทีจะเห็นชัดว่าจะมีความต้องการทักษะใหม่ๆเข้ามาเรื่อย ๆ เช่น Prompt Engineer ที่เริ่มมีประกาศรับสมัครหลังจาก Chat GPT เข้ามาไทยช่วงต้นปี พอเข้ามาปุ๊บก็เริ่มมีประกาศว่า ต้องการคนที่มาทำ Prompt Engineer คนที่จะคุยกับ Chat GPT ให้รู้เรื่อง คนที่รู้วิธีว่าพิมพ์อย่างไรเพื่อให้เอไอสามารถตอบคำถามให้ตรงกับที่เราต้องการได้ ซึ่งถือว่าเป็นความท้าทายกับงานนี้เมื่อต้องจับสัญญาณพวกอาชีพหรือทักษะใหม่ ๆ ให้ได้

อีกสิ่งสำคัญคือ ปรากฎการณ์ที่เห็นในช่วงปลายปี 2564 พบว่า การจ้างงานบางงาน ไม่ได้ให้ความสำคัญกับการระบุวุฒิการศึกษามี เช่น งานสายกลุ่มไอทีหลายบริษัทเริ่มไม่มีการระบุว่าขั้นต่ำจะต้องจบวุฒิการศึกษาอะไร ซึ่งเป็นได้ว่า ความต้องการแรงงานในกลุ่มนี้มีเพิ่มมากขึ้น ซึ่งงานไอทีก็มีหลายทักษะที่คนมาเรียนรู้เพิ่มเติมภายหลัง หรือเรียนรู้ด้วยตัวเองได้ไม่ว่าจะจบด้วยวุฒิอะไรก็ตาม

Q: ตำแหน่งอะไรที่เป็นที่ต้องการของตลาดแรงงาน

ที่เรารวบรวมข้อมูล เราจะดึงข้อมูลจากพวกเว็บประกาศรับสมัครงาน ซึ่งงานที่ต้องการมาก คืองานการตลาด รองลงมาคืองานที่เกี่ยวกับผู้สูงอายุ เช่น งานดูแลผู้สูงอายุ

แต่งานในกลุ่มไอที ที่เราเฝ้าติดตามเป็นพิเศษ พบว่า มีการประกาศในเว็ปรับสมัครงานในไตรมาสหนึ่งอยู่ที่ประมาณ 1,000-2,000 ตำแหน่ง แต่ในความเป็นจริงงานในกลุ่มนี้ยังกระจายประกาศรับสมัครอีกหลายที่ ในโซเชียลมีเดีย อย่างกลุ่มใน Facebook จะมีกลุ่มหางานที่หางานโปรแกรมเมอร์อย่างน้อยมีสมาชิกอยู่ในกลุ่มหลัก 100,000 คน และมีโพสต์ประกาศรับสมัครทุกวัน บางตำแหน่งงานอาชีพไปอยู่ในกลุ่มเฉพาะมากยิ่งขึ้น หรือแม้กระทั่ง Linkedin ก็เป็นอีกพื้นที่สำหรับมองหาคนทำงานเชี่ยวชาญเฉพาะทาง จึงยังเป็นข้อกำจัดที่การเก็บข้อมูลเรายังไปไม่ถึง ซึ่งในอนาคตเราจะมีการเพิ่มการรวบรวมข้อมูลในกลุ่มเหล่านี้ด้วย

Q แล้วงานแบบไหนที่เริ่มหายไป มีแนวโน้มร่วงจากเว็บประกาศรับสมัครงาน

ที่ดูแล้ว ไม่ค่อยประกาศคึกคักมากเท่าเดิม เป็นงานบริการบางส่วน เช่น พนักงานตามร้านอาหาร แต่ส่วนหนึ่งอาจจะเป็นเพราะว่าแหล่งประกาศรับสมัครงานนี้ อาจจะไม่ได้ผ่านเว็ปจัดหางานที่เรารวบรวมมา แต่มีการไปประกาศรับสมัครงานหน้าเพจของตัวเอง หรือ โพสต์รับสมัครงานตามโซเชียลมีเดียเช่นกัน

Q: ในมิติเชิงพื้นที่ ข้อมูลทำให้เราเห็นภาพการจ้างงานเป็นอย่างไร

ตลอด 5-6 ปี ที่ผ่านมาแนวโน้มการกระจุกตัวของการจ้างงานไม่เปลี่ยนแปลงไป คือ ตำแหน่งงานเกินครึ่ง กระจุกใน กทม. และปริมณฑล หรือ ถ้าแบ่งเป็นภาค ถือว่าในภาคตะวันออกก็จะพบตำแหน่งงานมากหน่อย เพราะเป็นไปตามโครงสร้างงานในพื้นที่ที่มีนิคมอุตสาหกรรมมาก แต่การเก็บข้อมูลเชิงพื้นที่เรามีความท้าทายในเชิงเทคนิคมากเหมือนกัน ในกรณีที่บริษัทใหญ่มีหลายสาขา ต้องเช็คว่าเขาระบุสาขา หรือจังหวัดไหม ถ้าระบุ เราก็ง่าย เราก็อ้างอิงจากตรงนั้นได้เลย แต่ถ้าไม่มีเราต้องไปอ้างอิงจากสำนักงานใหญ่อยู่ที่ไหน

Q : หลังๆมีเทรนด์อะไรที่เราเห็นได้มากขึ้น

เริ่มมีเทรนด์บางอย่างที่เห็นชัดตั้งแต่ปลายปี 2564 คือการ Work From Home เป็นเรื่องที่บริษัทเริ่มประกาศชัดเจนว่ามีนโยบายนี้ รวมถึงบางเว็บไซต์จะมีข้อตกลงว่า ไม่ให้จำกัดเรื่องของอายุและเพศสภาพของผู้สมัคร แตกต่างจากอดีตที่โครงสร้างประกาศหางานของไทยจะมีการประกาศชัดเจนว่า จะรับคนที่ช่วงอายุเท่าไหร่ เช่น รับคนอายุ 20-35 ปี แต่เทรนด์นี้เริ่มน้อยลงในบริษัทใหญ่ ซึ่งบริษัทก็จะได้ภาพและการรับรู้ว่าเปิดรับความหลากหลายของอายุและเพศ แต่สุดท้ายแล้วอาจจะมีการคัดกรองต่ออีกทีโดยบริษัทนั้นๆอีกภายหลังก็อาจเป็นไปได้

นอกจากนี้ยังมีข้อมูลเรื่องเงินเดือนที่ใส่รายละเอียดน้อยลง มักจะใช้คำว่า “ขึ้นอยู่กับการตกลงเจรจากัน” ส่วนที่ยังเห็นมีอยู่บ้างคือบริษัทขนาดเล็กหรือเป็นงานที่อยู่ในต่างจังหวัดที่ยังจะมีการบอกขั้นเงินเดือนชัดๆว่า 18,000 – 25,000 บาท

Q: ผลลัพธ์ที่ออกมาจากทีมหน้าตาเป็นแบบไหนถูกนำไปใช้อย่างไรแล้วบ้าง

เราได้นำผลการวิเคราะห์ความต้องการจ้างงานเผยแพร่เป็นบทวิเคราะห์รายไตรมาส (แนบลิงก์) ผ่านทางเว็บไซต์ของทีดีอาร์ไอ ซึ่งผู้สนใจสามารถนำไปใช้ประโยชน์ และอ้างอิงต่อได้

นอกจากนี้บทวิเคราะห์ที่ทำขึ้นสามารถส่งต่อไปให้มหาวิทยาลัยได้ เพื่อที่จะดูว่าหลักสูตรที่มหาวิทยาลัยสอนตรงกับทักษะที่นายจ้างต้องการหรือไม่ จะตอบสนองความต้องการของตลาดแรงงานอย่างไร อย่างหลักสูตรไอที มหาวิทยาลัยก็พยายามปรับตัวที่ทำให้หลักสูตรมีความยืดหยุ่นมากขึ้น คือ การมีพื้นที่ให้กับหน่วยกิตและรายเลือกที่ผู้สอนสามารถปรับประยุกต์เอาเนื้อหาปัจจุบันมาใส่ได้ ปกติ 5 ปี เปลี่ยนหลักสูตรครั้ง คำถามที่เกิดขึ้นคือ วินาทีที่กำลังเริ่มเขียนหลักสูตร เทคโนโลยีอาจจะเปลี่ยนแล้วก็ได้ เทคโนโลยีไปไวมากๆ ดังนั้นมหาวิทยาลัยจะเขียนคำอธิบายรายวิชา ที่กว้างมากๆเพื่อให้สามารถปรับเปลี่ยนเนื้อหาให้เข้ากับสถานการณ์ปัจจุบันมากที่สุด

อีกส่วนหนึ่ง คือ ข้อมูลส่วนนี้น่าจะช่วยตอบโจทย์ให้หน่วยงานบางหน่วยงานที่มีความต้องการพัฒนากำลังคน ซึ่งเขาก็จะทราบว่าควรจะให้การสนับสนุนในภาคส่วนไหนที่อาจจะมีความต้องการหรือยังขาดคนอยู่ ซึ่งทั้งหมดนี้จะเป็นประโยชน์สำหรับการกำหนดนโยบาย

Q : แพลนต่อไปของการวิเคราะห์ตลาดแรงงาน

เราจะปรับปรุงให้มีระบบมากขึ้น ให้มีการอัพเดทข้อมูลเป็นประจำ ให้ได้ข้อมูลที่ตรง เร็วและมีความคลีนพร้อมที่จะเอาไปประมวลผลต่อ ในส่วนของการประมวลผลด้านเอไอ อัลกอริทึม เราศึกษาว่าตัวไหนกำลังมา ใช้เอไอในการทำความเข้าใจกับภาษาคน เราต้องมีการอัพเดทเรื่อยๆ เพราะเทคโนโลยีพวกนี้ไปเร็วมาก ต้องดูว่าตัวไหนใช้แล้วได้ผลดี

แต่ก่อนวิธีการทำโมเดล เป็นวิธีการที่ต้องลงแรงมาก เพราะไม่ได้มีตัวช่วย แต่ตอนนี้มีวิธีการที่ทันสมัยขึ้นมากที่จะช่วยให้เราสามารถจำแนกกลุ่มอาชีพได้มากขึ้นในเวลาที่อาจจะเท่าเดิมแต่ไม่ได้ลงแรงเท่าเดิมแล้ว นอกจากนี้จะไปเพิ่มการไปดูประกาศรับสมัครงานในกลุ่ม Facebook ซึ่งเป็นข้อจำกัดของเรามีปีที่ผ่านมาด้วย เพื่อที่จะให้ภาพรวมของข้อมูลมีความครบถ้วนมากขึ้น

ในอนาคตเราพยายามขยายไปตอบโจทย์อื่นๆ ในกลุ่มอื่นๆ หลังจากที่ก่อนหน้านี้ เรามีโจทย์จากกลุ่มอาชีพที่เป็น STEM และเริ่มทำอาชีวะบ้าง กลุ่มแนวการตลาดเป็นกลุ่มที่มีจำนวนข้อมูลเยอะ เรามีความเชี่ยวชาญในการจำแนกประเภทงานพวกนี้

ดังนั้นเป้าหมายต่อไปคือ จะไปศึกษาประกาสรับสมัครงานในกลุ่มธุรกิจอุตสาหกรรม S-CURVE อาจจะมีบางส่วนที่ไป overlap กับสิ่งที่เราทำอยู่แล้วแต่อาจจะมีกลุ่มอาชีพบางอาชีพที่ก่อนหน้านี้เรายังไม่ได้เข้าไป รวมถึงกลุ่มธุรกิจ BCG ด้วย

ตั้งทีม Big Data ใช้ AI ช่วยวิจัย

ทุกครั้งที่ตั้งคำถาม จะเกิดเป็นหนทางใหม่ๆที่จะนำไปสู่การค้นหาคำตอบเสมอ

จากคำถามของนักวิจัยทีดีอาร์ไอ ที่ได้ตั้งข้อสังเกตต่อระบบการเก็บข้อมูลของภาครัฐ ที่ใช้ลักษณะ “การสุ่ม” ซึ่งอาจไม่ได้สะท้อนข้อมูลบางอย่างได้ทั้งหมด นำไปสู่การหาเครื่องมือใหม่ๆมาพัฒนาวิธีการรวบรวมข้อมูลที่มีมากมายมหาศาล ด้วยปัญญาประดิษฐ์ หรือ เอไอ โดยเริ่มทดลองจากการรวบรวมข้อมูลประกาศรับสมัครงานที่มีเป็นจำนวนมาก

จนกระทั่งมีการตั้งทีมวิจัย Big Data ของทีดีอาร์ไอขึ้น

“ดาต้ามีความสำคัญ เพราะเราสามารถประมวลผลข้อมูลจนเป็นองค์ความรู้ขึ้นมา การพัฒนาก็มาจากองค์ความรู้ ที่เอาไปต่อยอด ใช้จริง แต่การประมวลผล Big Data ต้องใช้คอมพิวเตอร์ จะทำอย่างไรให้คอมพิวเตอร์เรียนรู้ได้ พิเศษมากกว่า หรือทำให้มีความอัจฉริยะขึ้นมาได้ ก็เกิดจากการเรียนจากข้อมูลพวกนี้” ดร. ทศพล ป้อมสุวรรณ นักวิชาการ ทีม Big Data ทีดีอาร์ไอระบุ

นั่นหมายความว่าถ้าเรามีข้อมูลที่มากพอ และมีการเรียนรู้ที่ดีพอ เราจะสามารถเข้าใจปัจจุบัน และอาจทำนายอนาคตและรับมือกับการถูก Disrupt ที่เกิดจากมีสิ่งใหม่ๆเข้ามามีผลกระทบต่อชีวิตเราอย่างไม่ทันตั้งตัวได้ ถ้าเราสามารถทำนายได้ว่าเทรนด์จะเปลี่ยนไปอย่างไร การเตรียมตัวจะสามารถช่วยให้เรามีความพร้อมกับสิ่งที่จะเปลี่ยนแปลง

แต่ปัจจุบันการรวบรวมข้อมูลไม่ใช่เรื่องง่าย เพราะองค์กรต่างๆเริ่มที่จะเก็บข้อมูลเอาไว้ ไม่มีการเผยแพร่ออกสู่สาธารณะ เนื่องจากมองว่า ข้อมูลเป็นทรัพย์สินที่มีค่าชนิดหนึ่ง จึงมีความพยายามป้องกันไม่ให้คนอื่นเอาข้อมูลไปใช้ โดยบางองค์กรอาจจะสร้างโปรแกรมขึ้นมาต่อต้านไม่ให้เข้าถึงข้อมูล ขณะที่คนรวบรวมข้อมูลก็ต้องหาเทคนิคไม่ให้ถูกระบบบล็อคเวลาไปขอใช้ข้อมูล

“ก็เหมือนกับเวลาเราเล่นเกมแมวกับหนูนั่นแหละ” ทีม Big data เปรียบเปรยให้เห็นภาพ

ถ้าให้คนทำดาต้า มองการรวบรวมดาต้าของหน่วยงานภาครัฐในปัจจุบัน?

คุณวินิทร เธียรวณิชพันธุ์ มองว่า ยังมีความท้าทายหลายด้าน แม้ว่าที่ผ่านมาภาครัฐรับรู้ปัญหา และมีความพยายามที่จะจัดการ แก้ไขปัญหานี้ โดยเฉพาะหน่วยงานของกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม หรือ ดีอีเอส ที่ทำเรื่อง Open Data แต่กำลังคนไม่เพียงพอต่อปริมาณข้อมูลที่มหาศาล

“การดำเนินงานจึงเป็นเพียง ผู้ประสาน ในลักษณะที่ว่า ถ้าแต่ละหน่วยงานมีความพร้อมที่จะแชร์ข้อมูลให้กับส่วนกลางหรือให้กับคนทั่วไป เขาสร้างทีมสร้างระบบไว้ แต่ปัญหาจริงๆ ตอนนี้คือ ถ้าในเชิงข้อมูล คนในระดับปฏิบัติการในแต่ละหน่วยงาน อาจจะไม่ได้เห็นความสำคัญในเรื่องรูปแบบการจัดเก็บเท่าไหร่ ว่าจะทำอย่างไรให้แชร์แล้วเอาไปใช้ประโยชน์ได้”

นอกจากนี้ยังมีอุปสรรคในเชิงเทคนิคของการรวบรวมข้อมูล คือ ไฟล์ข้อมูลที่จะสามารถนำไปใช้ได้ จะต้องเก็บในไฟล์ตาราง ที่คอมพิวเตอร์สามารถอ่านได้ แต่ที่พบส่วนใหญ่จะถูกจัดเก็บในไฟล์ PDF หรือ รูปภาพ ซึ่งการเก็บข้อมูลเหล่านี้จะต้องใช้คนไปประมวลผล ซึ่งเป็นการทำงานที่ซ้ำซ้อน

ขณะเดียวกันยังพบว่า ข้อมูลบางประเภทที่มีหลายหน่วยงานเป็นเจ้าของ แต่เมื่อนำข้อมูลของสองหน่วยงานมาชนกัน ปรากฎว่า ตัวเลขกลับไม่ตรงกันก็มี

ทางออกในเรื่องนี้ ทีม Big data เสนอว่า ควรมีเจ้าภาพ ที่จัดอบรมทำความเข้าใจกับบุคลากรภาครัฐที่มีหน้าที่จัดทำข้อมูล ให้เข้าใจตรงกันว่าการจัดการข้อมูลที่ดีคือแบบไหน เพื่อให้สามารถใช้ข้อมูลร่วมกันระหว่างหน่วยงานได้ หรือหากจะมีการออกแบบรูปแบบการเก็บข้อมูลให้ใช้แบบเดียวกันทั้งหมดก็จะเป็นวิธีการที่ดีมาก

“ตอนนี้มีปัญหาอยู่ว่าใครเป็นเจ้าภาพ ใครจะถือข้อมูลหรือว่าแม้กระทั่งการออกแบบระบบ ซึ่งวิธีการของระบบหน่วยงานภาครัฐโดยทั่วไปก็คือการประมูลจัดซื้อจัดจ้างหาคนมาพัฒนาระบบ ดังนั้นแต่ละระบบก็จะมีระบบจัดเก็บฐานข้อมูลที่บางทียากกับการที่จะเชื่อมให้ระบบมันคุยกันรู้เรื่องได้”

อย่างไรก็ตามปัจจุบันมีบางหน่วยงาน ที่มีโมเดลซึ่งเป็นตัวอย่างสำหรับหน่วยงานอื่นได้ คือ ระบบแฟ้มงานของกระทรวงสาธารณสุข ที่มีความพยายามออกแบบฐานข้อมูลกลาง เพื่อให้แต่ละโรงพยาบาลเวลาที่จะรายงานเข้ามา มีรูปแบบการเขียนที่เหมือนกัน เป็นข้อมูลที่เป็นระบบเดียวกัน เวลาใช้ก็ใช้ได้ทั้งจากโรงพยาบาลรัฐและโรงพยาบาลเอกชน

สำหรับแผนต่อไปของทีม Big Data ทีดีอาร์ไอนั้น คือการนำ Generative AI ที่กำลังมาแรง มาตัวช่วยในการทำงานวิจัยบางงาน ที่ต้องใช้กำลังคนมากอย่างการอ่านรายงาน ESG (รายงานความยั่งยืนองค์กร) ซึ่งมีความยาวมาก จำนวนหลายร้อยถึงหลักพันหน้า จากเดิมที่คนต้องอ่านทีละ มาเป็นให้เอไอ ช่วยจับประเด็นสำคัญออกมาให้ได้ก่อนว่าหน้าที่มีประเด็นสำคัญ แล้วให้คนเข้ามาอ่านเจาะตรงนั้นอีกทีหนึ่ง จะช่วยลดเวลาไปได้มาก

นอกจากนี้จะมีการรวบรวมข้อมูล จากภาพถ่ายดาวเทียมด้วย ซึ่งดาต้าที่เป็นภาพถ่ายดาวเทียม จะสามารถตอบโจทย์ได้หลายโจทย์ เช่น การพัฒนาของเมือง

ผู้สนใจติดตามผลงานจากทีม Big Data สามารถติดตามได้จาก เว็บไซต์ทีดีอาร์ไอ และ โซเชียลมีเดีย ทีดีอาร์ไอ

Website: tdri.or.th

FB: https://www.facebook.com/tdri.thailand

Tiktok: https://www.tiktok.com/@tdri.thailand

Twitter: https://twitter.com/tdri_thailand

Instagram: https://www.instagram.com/tdri.thailand/