รู้ก่อนเขา...อิเหนากำไร: ทำนายตัวเลขเศรษฐกิจในยุค Big Data (ตอนที่ 1)

รู้ก่อนเขา...อิเหนากำไร: ทำนายตัวเลขเศรษฐกิจในยุค Big Data (ตอนที่ 1)
Stock2morrow

สนับสนุนเนื้อหา

ในโลกของการลงทุนนั้น คงปฏิเสธไม่ได้ว่าความเร็ว (กว่าคู่แข่ง) สำคัญไม่แพ้กับความแม่นยำของข้อมูล ในยุคที่ Big Data กับ AI กำลังเข้ามาเป็นส่วนสำคัญมากขึ้นในการลงทุนนั้น จุดหนึ่งที่ความก้าวหน้าทางเทคโนโลยีและศาสตร์แห่งการวิเคราะห์ข้อมูลสามารถสร้างความได้เปรียบ หรือ “edge” ให้กับผู้เล่นในตลาดได้คือการช่วยทำนายตัวเลขเศรษฐกิจได้ก่อนตัวเลขทางการจะถูกประกาศ

ซึ่งนอกจากความแม่นยำของเทคนิคการทำนายมีแนวโน้มว่าจะดีขึ้นเรื่อยๆ แล้ว (ตามปริมาณข้อมูลที่เพิ่มขึ้นทุกวี่วันและประเภทข้อมูลที่หลากหลายขึ้น) ยังมีข้อได้เปรียบอื่นๆ อีก เช่น ความถี่ของข้อมูล (ไม่ใช่แค่รายเดือน แต่ทำนายรายวันก็ยังได้) และความลึก (ไม่ใช่แค่ระดับชาติ หรือ ระดับประเภทสินค้า แต่อาจเป็นระดับซอยหมู่บ้าน หรือระดับสินค้าเป็นยี่ห้อไปเลย)
บทความซีรี่ส์พิเศษ "รู้ก่อนเขา...อิเหนากำไร: ทำนายตัวเลขเศรษฐกิจในยุค Big Data " จะพาท่านผู้อ่านไปสัมผัสกับความเคลื่อนไหวในวงการวิชาการว่าได้มีการนำข้อมูลหลากหลายรูปแบบที่เราอาจคิดไม่ถึง ไปช่วยทำนายตัวเลขเศรษฐกิจอะไรได้แล้วบ้าง


ผู้เขียนหวังว่าการ “แง้มดู” ประตูอนาคตนี้ก่อนที่มันจะเปิดกว้างจนกลายเป็นอะไรที่ใครๆ ก็ทำได้ (แล้วก็ไม่เป็น edge ของใครอีกต่อไป) น่าจะเป็นประโยชน์กับเหล่านักลงทุนแห่ง stock2morrow ครับ


ข้อมูลทางด่วนมีค่ามากกว่าแค่คิดเงินให้ถูก

ในบรรดาตัวเลขเศรษฐกิจทั้งหมด อัตราการเติบโตของเศรษฐกิจ หรือ GDP growth น่าจะเป็นตัวเลขที่มีความสำคัญที่สุดและมีผู้ติดตามมากที่สุด ลองสมมุติดูนะครับว่าหากเราสามารถทำนายตัวเลขนี้ได้แม่นกว่า “กูรู” แถมยังทำนายได้ก่อนมันถูกประกาศเป็นเดือนๆ จะดีแค่ไหน?

มีนักวิจัยเศรษฐศาสตร์อยู่ทีมหนึ่งคิดว่าความเปลี่ยนแปลงของระดับ “กิจกรรมการขนส่ง” ในประเทศน่าจะสามารถเอามาใช้ทำนายตัวเลข Production Index (ซึ่งมักนำหน้าทิศทางของ GDP growth) ก่อนที่มันจะถูกประกาศในไม่ช้าได้

หลักการจริงๆ แล้วง่ายมาก: ยิ่งมีรถขนส่งวิ่งไปวิ่งมาถี่ขึ้น ระยะทางรวมแล้วมากขึ้น ก็ยิ่งน่าจะแปลว่าเศรษฐกิจกำลังมีแนวโน้มที่ดีขึ้น

งานวิจัยของ Askitas กับ Zimmermann (http://ftp.iza.org/dp5522.pdf) ลองทดสอบสมมุติฐานนี้โดยใช้ข้อมูลระยะการเดินทางของรถบรรทุกที่เก็บโดยระบบทางด่วนในประเทศเยอรมาสร้างเป็นดัชนีทางด่วน (Toll Index) เพื่อทำนาย German Production Index (GPI)

ในประเทศเยอรมัน รถบรรทุกที่หนักกว่า 12 ตันจะต้องติดตั้งระบบจ่ายค่าทางด่วนซึ่งจะผูกกับระบบ GPS และ GSM เสมอ เพื่อคำนวนให้ได้ว่าเดินทางไกลเท่านี้จะต้องจ่ายค่าทางด่วนเท่าไหร่ แต่ในเมื่อข้อมูลเหล่านี้มันมีอยู่แล้ว Askitas กับ Zimmermann จึงนำข้อมูลระยะทางที่ขนส่งในแต่ละเดือนมาทำเป็นดัชนีทางด่วนของประเทศเยอรมันขึ้น

st2

ผลปรากฏว่า (ภาพด้านบน) ดัชนีทางด่วน (ทั้ง 4 แบบ) ค่อนข้างแปรผันตาม GPI อย่างที่คาดไว้ แต่ที่สำคัญคือข้อมูลทางด่วนจะออกมาก่อนที่ตัวเลข GPI ถูกประกาศ ซึ่งแปลว่าเราสามารถสร้างดัชนีทางด่วนได้ก่อนตัวเลข GPI จะถูกประกาศได้ถึง 1 เดือนเต็มๆ


สร้างข้อมูลเงินเฟ้อจากรูปถ่ายมือถือและค้าปลีกออนไลน์


นอกจากอัตราการเติบโตทางเศรษฐกิจแล้ว อีกหนึ่งตัวเลขที่สำคัญไม่แพ้กันคือระดับราคาสินค้า หรือ อัตราเงินเฟ้อในระบบเศรษฐกิจ

st3

ตัวอย่างแรกของการบุกเบิกในด้านนี้คือบริษัทจาก Silicon Valley ชื่อ Premise ที่มีระบบเทคโนโลยีที่น่าสนใจ พวกเขาจ่ายค่าจ้างเล็กน้อย (ซึ่งอาจสูงมากในประเทศที่ด้อยพัฒนา) ให้กับคนในท้องที่ในกว่า 30 ประเทศเพื่อให้ไปสำรวจราคาสินค้าต่างๆ แล้วถ่ายรูปส่งกลับมาเพื่อให้ Premise สร้างดัชนีราคาของสินค้าหลากหลายประเภทได้ในระดับรายวัน

ซึ่งนอกจากจะเป็นข้อมูลราคาที่มีความถี่ยิ่งขึ้นและสามารถไปไกลถึงประเทศที่ไม่ค่อยมีข้อมูล (แต่ประชาชนมักมีโทรศัพท์มือถือ) ได้แล้ว การพยากรณ์โดยใช้ข้อมูลจากภาพถ่ายเหล่านี้ยังมีความแม่นยำไม่เบาอีกด้วย องค์การอาหารและการเกษตรแห่งสหประชาชาติ (FAO) ได้ทำการศึกษาความแม่นยำของดัชนีเหล่านี้และได้ผลสรุปว่าดัชนีอาหารของ Premise จากประเทศบราซิล สามารถทำนายเทรนด์ของราคาอาหารจริงๆ ของประเทศบราซิล ได้ก่อนถึง 25 วัน (http://blog.premise.com/data/science/2014/12/22/UN-FAO/)

st4

อีกหนึ่งตัวอย่างที่มี potential สูงคือโปรเจคพันล้านราคาหรือ “The Billion Prices Project” (http://bpp.mit.edu/usa) โดยทีมนักวิจัยแห่งมหาวิทยาลัย MIT โปรเจคนี้เป็นการจับมือระหว่างนักวิชาการแนวหน้ากับกลุ่มธุรกิจค้าปลีกหลายร้อยรายเพื่อเก็บข้อมูลราคาสินค้าออนไลน์ทุกวันเพื่อนำมาเทียบกับดัชนีราคาผู้บริโภค (CPI) ของเศรษฐกิจจริงที่ปกติแล้วประกาศออกมาอย่างถี่ที่สุดก็รายเดือน

จุดเด่นของการใช้ข้อมูลราคาสินค้าออนไลน์คือปริมาณ ความละเอียด และความถี่ของข้อมูล แต่จุดด้อยที่หลายคนกังวลคือการช๊อปปิ้งออนไลน์มันน่าจะต่างกับการช๊อปปิ้งออฟไลน์มาก อีกทั้งประเภทสินค้าก็น่าจะไม่ค่อยเหมือนกับตะกร้า CPI ที่ทางการใช้

แต่พวกเราคงวางใจได้ส่วนหนึ่ง เพราะงานวิจัยที่เพิ่งได้ตีพิมพ์ในวารสารวิชาการอันดับต้นๆ ในสาขาเศรษฐศาสตร์พบว่าระดับราคาสินค้าออนไลน์ของ The Billion Prices Project กับระดับราคาสินค้าออฟไลน์ทางการนั้นเท่ากันถึง 72% ซึ่งผมคิดว่าดีกว่าที่นึกไว้มาก (https://www.aeaweb.org/articles?id=10.1257/aer.20160542)

ที่น่าสนใจอีกอย่างก็คือ ด้วยความละเอียดของข้อมูลราคาสินค้าออนไลน์ เรายังสามารถทราบได้อีกด้วยว่าราคาออฟไลน์กับราคาออนไลน์นั้นห่างมากที่สุดหรือน้อยที่สุดในสินค้าจำพวกใด (ห่างมากที่สุดสำหรับสินค้าประเภทอาหารและยาและห่างน้อยที่สุดในสินค้าประเภทอิเล็กทรอนิกส์) นอกจากนั้นการที่เราทราบระดับราคาสินค้าเป็นรายสินค้า ไม่ใช่ราย industry ยังมีโอกาสช่วยให้เราเรียนรู้ก่อนคนอื่นได้อีกด้วยว่าราคาสินค้าอะไรมักเป็นตัวนำภาวะเงินเฟ้อ

st5

จุดหนึ่งที่ต้องย้ำคือตัวอย่างทั้งสามตัวอย่างในบทความนี้จะยังอยู่ใน “ช่วงทดสอบ” และยังมีข้อสงสัยและบททดสอบอีกมากที่เทคนิคเหล่านี้ยังต้องเผชิญก่อนที่มันจะกลายเป็นที่ยอมรับมากขึ้น ตัวอย่างแรกที่ใช้ข้อมูลค่าทางด่วนมาทำนาย GPI ก็มีกระแสโต้แย้งว่าทำนายได้ดีแค่ในบาง time frame แต่ไม่ได้ทำนายกับได้ดีกว่าข้อมูลประเภทอื่น เช่น แบบสอบถามผู้ประกอบการที่ประกาศก่อนข้อมูลทางด่วนเท่าไหร่นัก

อย่างไรก็ตาม ผมมองว่าด้วยแนวโน้มที่ข้อมูลจะมีปริมาณเพิ่มขึ้นตามจำนวน devices ที่สามารถเก็บข้อมูลพฤติกรรมมนุษย์ได้ และความก้าวหน้าทางเทคนิคการวิเคราะห์ข้อมูลที่จะทำให้การพยากรณ์นอกช่วงตัวอย่าง (out-of-sample) มีความแม่นยำมากขึ้น เราจะมีโอกาสได้เห็นการใช้ข้อมูลใหม่ๆ ในการทำนายตัวเลขเศรษฐกิจกันมากขึ้นครับ

บทความโดย stock2morrow เขียนโดย คุณณภัทร จาตุศรีพิทักษ์
ติดตามบทวิเคราะห์จากมุมมองเศรษฐศาสตร์ที่เข้าใจง่ายได้ที่ www.settakid.com ครับ