سینا، همبنیانگذار صندوق سرمایهگذاری ۲۱st Capital، بهتازگی بهطور عمومی یکی از مدلهای مشهور پیشبینی قیمت بیتکوین را که توسط رائول پال، مدیرعامل Real Vision، معرفی شده بود، زیر سوال برد. او این مدل را نمونهای کلاسیک از «بیسوادی دادهای» و «بیشبرازش» (overfitting) دانست.
مدلی که مورد انتقاد قرار گرفته، بر پایهی رابطهای نزدیک بین قیمت بیتکوین و شاخص M2 جهانی (که نشاندهندهی عرضه پول جهانی است) بنا شده است. در این مدل، دادههای M2 با یک تأخیر زمانی مشخص، معمولاً ۱۰ تا ۱۲ هفته، به جلو منتقل میشوند تا بهاصطلاح حرکات قیمتی آینده بیتکوین را «پیشبینی» کنند. رائول پال با استفاده از این نمودار استدلال میکند که شرایط نقدینگی کلان اقتصاد، چرخههای رمزارزی را هدایت میکند و میتوان رفتار فعلی بازار را از طریق گسترش نقدینگی تحلیل کرد.
نقد شدید به ارتباط M2 و بیتکوین
اما سینا، که یک دانشمند دادهی آموزشدیده و مدرس تجزیهوتحلیل داده در سطوح کارشناسی و کارشناسی ارشد است، میگوید این مدل با بررسی دقیق از هم فرو میپاشد. او در یک ویدئوی منتشر شده در ۲۴ ژوئن در شبکه اجتماعی X گفت: «این یک شکست وحشتناک در درک مفهوم بیشبرازش است. آنچه من میبینم حتی از آزمون اولین ماه از دورهی اول تجزیهوتحلیل داده عبور نمیکند.»
سینا توضیح میدهد که این همبستگی ظاهری میان بیتکوین و M2 جهانی صرفاً به دلیل «شکنجهی دادهها» برای تطبیق با الگوهای گذشته ایجاد شده است. او هشدار داد: «اگر اجازه داشته باشم با دادهها بازی کنم و چیزها را بهدلخواه جابهجا کنم، قطعاً میتوانم تطبیقهای فوقالعادهای بین بخشهایی از دادهها پیدا کنم.» به گفته او، همین انعطافپذیری است که باعث میشود تحلیلگران توهم دقت پیشبینی را ایجاد کنند.
وی افزود که خود دادههای M2 جهانی ذاتاً مشکلدار هستند، زیرا این شاخص از طریق ضرب ارقام M2 بانکهای مرکزی مختلف در نرخهای ارز محاسبه میشود؛ این دادهها شامل اقتصادهایی است که اطلاعات را سریع منتشر میکنند (مثل آمریکا) و کشورهایی که دادههایشان با تأخیر چند هفته یا چندماهه منتشر میشود. این کار باعث ایجاد تصویری نادرست از نوسانات روزانه نقدینگی جهانی میشود. سینا گفت: «به نظر میرسد این دادهها روزانه حرکت میکنند، اما در واقع ترکیبی از دادههای با بهروزرسانی سریع و کند هستند. این یک سیگنال واقعی نیست.»
مدلسازی یا بازی با داده؟
از نگاه سینا، مشکل اصلی این است که وقتی از تکهنمودارهای انتخابشده فاصله میگیریم، مدل کاراییاش را از دست میدهد. رائول پال و سایر طرفداران مدل، مواردی از تطبیق دقیق سقفها و کفهای قیمت بیتکوین با M2 را بهنمایش گذاشتهاند. اما سینا با تغییرات جزئی در زمان پیشفرض یا مقیاس، نشان داد که نتایج کاملاً متفاوت میشوند. او با لحنی طعنهآمیز گفت: «بیا با یک تأخیر ۸۰ روزه امتحان کنیم. خوب نیست. ۱۰۸ روز چطور؟ آها، حالا سقفها تطبیق دارند—پس دوباره بزرگنمایی کنیم و وانمود کنیم که مدل جواب میدهد. این مدلسازی نیست، این بازی است.»
او تأکید کرد که تغییر مداوم تأخیرها و پارامترها، از ۱۲ هفته به ۱۰ هفته یا ۱۰۸ روز، نشاندهندهی نبود پایهی سیستماتیک در مدل است. سینا گفت: «اگر مدل درستی نداشته باشی، نمیتوانی آینده را پیشبینی کنی. این یک نمونه کلاسیک از بیشبرازش است. شما دادهها را مجبور میکنید تا با رفتار گذشته تطبیق پیدا کنند، اما هیچ تعمیمپذیریای به آینده ندارد.»
سینا برای روشنسازی این مفهوم، آن را با برازش یک منحنی بر یک موج سینوسی پر از نویز مقایسه کرد. به گفته او، یک مدل ساختاریافته الگوی اصلی را میگیرد و نویز را نادیده میگیرد، در حالی که یک مدل بیشبرازششده سعی میکند همه نوسانات کوچک را هم دنبال کند—که در نتیجه عملکرد پیشبینی بسیار ضعیفی در مواجهه با دادههای جدید خواهد داشت. او گفت: «بیشبرازش بهتر بهنظر میرسد، اما نویز را مدل میکند. و نویز تکرار نمیشود.»
آیا بیتکوین پیشرو است یا دنبالهرو؟
سینا همچنین این فرضیه را زیر سوال برد که بیتکوین دنبالهروی نقدینگی است. او گفت: «اگر به چرخهی قبلی نگاه کنیم، بیتکوین زودتر سقف زد. نقدینگی ۱۴۵ روز بعد به سقف رسید.» این موضوع سبب میشود جهت علیت فرضشده در مدل M2 کاملاً وارونه شود و تمام ادعای آن درباره پیشبینیپذیری آینده زیر سوال برود.
او در پایان نتیجهگیری کرد: «باید خیلی مراقب بیشبرازش بود. بهنظر میرسد که همخوانی دارد، اما در واقع صرفاً بهزور بر دادههای تاریخی منطبق شده است. هیچ اطلاعی از دقت پیشبینی این مدل وجود ندارد.»
در زمان نگارش این گزارش، قیمت بیتکوین ۱۰۶٬۹۵۲ دلار بوده است.