เร็วๆนี้ รายงานชื่อ Billionaire Bonanza 2020 เผยว่ามหาเศรษฐีอเมริกัน 170 คน มีทรัพย์สินเพิ่มขึ้น 9 ล้านล้านบาท ในวิกฤตโควิด ขณะที่คนในประเทศตกงานแล้วกว่า 20 ล้านคน

(อ่านเพิ่มเติม มหาเศรษฐีอเมริกันรวยขึ้น 9 ล้านล้านบาท ในวิกฤตโควิด)

ชัค คอลลินส์ จากสถาบันนโยบายศึกษา และหนึ่งในผู้เขียนรายงานดังกล่าว ชี้ว่านอกจากสถานการณ์จะเอื้อให้ธุรกิจของบิลเลียนแนร์กลุ่มนี้ (อี-คอมเมิร์ซ, คลาวด์เซอร์วิส, วิดีโอ คอนเฟอเรนซ์ ฯลฯ) เติบโตแล้ว

อีกปัจจัยที่ทำให้คนกลุ่มนี้ได้เปรียบชนชั้นกลางและล่าง คือช่องโหว่ทางภาษี เมื่อพบว่าในช่วง 40 ปีหลังสุด คือจากทศวรรษที่ 1980 เป็นต้นมา มหาเศรษฐีอเมริกันจ่ายภาษีลดลงถึง 79%

ทั้งที่ภาษีควรจะเป็นเครื่องมือในการลดความเหลื่อมล้ำทางเศรษฐกิจมากกว่า

แต่การออกแบบนโยบายด้านภาษีที่สร้างสมดุลให้กับทุกฝ่าย ก็ไม่ใช่เรื่องง่าย เพราะพฤติกรรมเชิงเศรษฐศาสตร์ในสังคมมีความซับซ้อนสูง และการรวบรวมข้อมูลเพื่อนำมาประกอบก็เป็นเรื่องยาก

ลดความเหลื่อมล้ำด้วยนโยบายภาษีจาก AI

เมื่อการจัดการข้อมูลมหาศาลและซับซ้อนเป็นเรื่องยากเกินไปสำหรับมนุษย์ จึงเป็นที่มาของไอเดียมอบหน้าที่นี้ให้ AI ที่เชี่ยวชาญเรื่องข้อมูลดีกว่าเรา

ทีมนักวิทยาศาสตร์ของ Salesforce นำโดย ริชาร์ด โซเชอร์ พัฒนา AI Economist ด้วย reinforcement learning ซึ่งเป็นเทคนิคเดียวกับที่ DeepMind สอน AI “AlphaZero” ให้เล่นหมากกระดานชนิดต่างๆได้เชี่ยวชาญไม่แพ้แชมป์โลกที่เป็นมนุษย์

จุดประสงค์ในการพัฒนา AI ตัวนี้ คือเพื่อออกแบบนโยบายภาษี ที่ใช้ประโยชน์จากข้อมูลให้มากขึ้น และลดปัจจัยเชื่อมโยงด้านการเมืองลง

ในการประมวลผลครั้งหนึ่ง ก็ค้นพบนโยบายที่สามารถลดความเหลื่อมล้ำลงได้ โดยไม่กระทบประสิทธิภาพในการผลิต ซึ่งให้ผลดีกว่ากรอบภาษีอัตราก้าวหน้าที่นักเศรษฐศาสตร์เชิงวิชาการศึกษาอยู่ในปัจจุบัน ถึง 16%

AI คนงาน vs AI กำหนดนโยบาย

หลักการทำงานของ AI Economist คือแบ่ง AI ออกเป็นสองส่วน แต่ละส่วนมีความสามารถในการเรียนรู้ด้วยตัวเอง ผ่านโมเดล reinforcement learning

ส่วนแรกคือ AI คนงาน จำนวน 4 ตัว มีสองบทบาท คือ 1) รวบรวมไม้และก้อนหิน และ 2) เลือกว่าจะแลกเปลี่ยนทรัพยากรเหล่านี้กับ AI อื่นๆ หรือนำไปสร้างบ้านเพื่อสร้างรายได้

AI ในกลุ่มนี้ แต่ละตัว มีระดับทักษะที่แตกต่างกัน จึงมีความชำนาญที่ต่างกัน ตัว ที่มีทักษะต่ำกว่า จะเก่งในการรวบรวมทรัพยากร ส่วนตัวที่มีทักษะสูงกว่า จะถนัดในการซื้อทรัพยากรเพื่อนำมาสร้างบ้าน (หาเงินได้เก่่งกว่า)

เมื่อสิ้นสุดการจำลองสถานการณ์ในแต่ละปี ทั้งหมดจะต้องจ่ายภาษีในอัตราที่กำหนดโดย AI ส่วนที่สอง ซึ่งเป็นผู้กำหนดนโยบาย โดยมีเป้าหมายคือกระตุ้นให้ AI คนงานทั้งสี่คนทำงานได้ดีขึ้น และมีรายได้เพิ่มขึ้น เพื่อนำภาษีเข้าคลังให้มากขึ้น

ทีมวิจัยเลือกใช้เทคนิค reinforcement learning เพื่อให้ AI ทั้งสองส่วนเรียนรู้หลักการด้านเศรษฐศาสตร์ด้วยตัวเอง โดยไม่ใส่ความรู้ด้านนี้ให้เลย

AI ทั้งหมดจึงค่อยๆพัฒนาตัวเองจากการลองถูกลองผิด ผ่านการจำลองเหตุการณ์ซ้ำๆเป็นล้านครั้ง (เหมือนที่ AlphaZero คิดค้นกลยุทธ์บนกระดานหมากที่ไม่เคยมีใครใช้มาก่อน)

การเรียนรู้ของทั้งสองฝ่าย (คนงาน และผู้กำหนดนโยบาย) ทำให้ต้องปรับบทบาทตามความเคลื่อนไหวของอีกฝ่าย

เช่น เมื่อ AI ฝ่ายคนงานเรียนรู้ที่จะจ่ายภาษีให้น้อยลง ด้วยการลดกำลังการผลิต AI ที่กำหนดนโยบายก็จะต้องหาวิธีใหม่ๆมากระตุ้น ทำให้นโยบายด้านภาษีของ AI Economist ไม่ตายตัว

จุดสังเกตจากทีมวิจัย คือนโยบายภาษีที่ AI ฝ่ายนโยบายเขียนขึ้นจากการเรียนรู้ ค่อนข้างขัดกับความรู้สึก และสิ่งที่มนุษย์เลือกทำ

คือผสมทั้งหลักการของภาษีอัตราก้าวหน้า (คนรายได้สูงจ่ายภาษีมาก) และอัตราถดถอย (คนรายได้มากจ่ายภาษีต่ำ) เข้าด้วยกัน

แต่ผลลัพธ์ที่ได้คือสามารถลดความเหลื่อมล้ำระหว่างคนรวยและคนจนลงได้

เพื่อทดสอบว่านโยบายภาษีแบบนี้ใช้ได้กับมนุษย์จริงๆหรือไม่ ทีมวิจัยได้ลองนำไปทดสอบในการจ้างงานประเภท crowdworking ผ่านแพลตฟอร์ม Mechanical Turk ของ Amazon

ผลปรากฎว่าพฤติกรรมของคนที่ถูกจ้าง คล้ายกับ AI คนงานมาก นั่นแปลว่าโดยหลักการแล้ว นโยบายภาษีที่ AI พัฒนาขึ้น น่าจะนำมาใช้ควบคุมกิจกรรมทางเศรษฐกิจในชีวิตจริงได้

ใส่ตัวแปรในแซนด์บ๊อกซ์ ประเมินสถานการณ์ล่วงหน้า

อีกจุดเด่นของ AI Economist ที่ทีมวิจัยพูดถึง คือเราสามารถใช้มันเป็นแซนด์บ๊อกซ์ ทดลองความเป็นไปได้ที่จะเกิดขึ้น เพื่อคาดการณ์ล่วงหน้าได้ด้วย

เช่น ทดสอบว่าผลกระทบจากโรคระบาดจะเป็นอย่างไร ด้วยการเพิ่มตัวแปรอื่นๆลงไป อย่างการต้องใช้ชีวิตแบบ social distancing การจำกัดการเข้าถึงทรัพยากรต่างๆ หรือการลดจำนวนแรงงานลง ฯลฯ

เพราะสถานการณ์ที่ “อาจเกิดขึ้น” เหล่านี้ บางครั้งไม่สามารถอ้างอิงจากเหตุการณ์ในอดีตได้ เนื่องจากมีตัวแปรอื่นๆที่ต่างออกไป

กลับกัน ถ้ากลุ่มตัวอย่างมีพฤติกรรมคล้าย AI ก็แปลว่าผู้วางนโยบายจะคาดเดาล่วงหน้าได้ระดับหนึ่ง ว่าแรงงานจะปฏิบัติตัวอย่างไร ภายใต้เงื่อนไขของนโยบายภาษีที่นำมาใช้

ใช้ได้แค่ทางทฤษฎี หรือมีโอกาสในชีวิตจริง?

คำถามก็คือ เราสามารถยึดหลักเกณฑ์จากงานวิจัยที่ใช้ AI คนงานเพียงสี่ตัวได้หรือไม่?

ในทางทฤษฎีนั้นถือว่าทำได้ เพราะการโต้ตอบแบบพื้นฐานระหว่างตัวแทนจำนวนวแค่หยิบมือ ก็สามารถพัมนาไปสู่พฤติกรรมที่ซับซ้อนขึ้นได้ เหมือนที่ AlphaZero ใช้ AI แค่สองตัวเรียนรู้กลยุทธ์บนหมากกระดานต่างๆ จนเก่งกว่ามนุษย์

ดอย์น ฟาร์เมอร์ นักเศรษฐศาสตร์จากมหาวิทยาลัยออกซ์ฟอร์ด ยอมรับว่าการเรียนรู้จากการจำลองสถานการณ์เป็นแนวคิดที่น่าสนใจ แต่ก็ยังเชื่อว่ากว่าโมเดลนี้จะใช้งานได้จริง ก็อาจต้องใช้เวลาอีกพอสมควร

“คุณสามารถวิเคราะห์นโยบายต่างๆได้ ในลักษณะเดียวกับที่คุณวิเคราะห์การเล่นหมากล้อมของ AlphaZero รึเปล่า? เพราะในโลกจริงมันซับซ้อนกว่านั้นมาก”

ขณะที่ เบลค เลอบารอน จากมหาวิทยาลัย แบรนไดส์ ในแมสซาชูเสตต์ส ให้ความเห็นว่าการทดลองนี้ ใช้ AI จำนวนน้อยเกินไป การจะให้ผลลัพธ์เป็นที่ยอมรับในวงกว้างในทันทีคงเป็นเรื่องยาก

พร้อมเสนอว่าควรเพิ่มจำนวนคนงานถึง 100 คน ซึ่งเป็นตัวเลขที่ทีมงานของ Salesforce ตั้งเป้าไว้เช่นกัน

แนวทางของ โซเชอร์ ในฐานะหัวหน้าทีมวิจัย คือในอนาคต จะเปิดโอเพ่นซอร์สให้ผู้สนใจนำโค้ดนี้ไปจำลองสถานการณ์ด้วยตัวเอง เพื่อให้เห็นภาพว่าการทำงานของ AI ในเชิงเศรษฐกิจนี้เป็นอย่างไร

“เพราะถ้าคุณจะใช้ AI แนะนำว่าคนกลุ่มไหนควรจะจ่ายภาษีมากขึ้นหรือน้อยลง คุณควรจะต้องตอบได้ด้วยว่าทำไม” โซเชอร์ สรุป

อ่านเพิ่มเติม

ผลสำรวจพบคนยุโรป 1 ใน 4 พร้อมให้ AI ปกครอง เพราะเบื่อรัฐบาลและนักการเมือง

นิวซีแลนด์สร้าง SAM นักการเมือง AI คนแรกของโลก

Universal Basic Income ทางออกของความเหลื่อมล้ำ และทางรอดในยุคหุ่นยนต์ครองเมือง

เรียบเรียงจาก

An AI can simulate an economy millions of times to create fairer tax policy

Improving Equality and Productivity with AI-Driven Tax Policies

Billionaire Bonanza 2020

AHEAD ASIA นวัตกรรม ล้ำหน้า