یک گروه بینالمللی از ریاضیدانان به رهبری تاهو کیم، آماردان دانشگاه لیهای، روش جدیدی را برای تولید پیشبینیهایی که به نتایج واقعی نزدیکتر است، توسعه دادهاند. هدف روشهای آنها بهبود پیشبینیها در بسیاری از زمینههای علم، بهویژه تحقیقات بهداشتی، زیستشناسی و علوم اجتماعی است.
محققان روش خود را برآورد خطی حداکثر توافق یا MALP می نامند. هدف اصلی آن بهبود میزان مطابقت مقادیر پیش بینی شده با مقادیر مشاهده شده است. MALP این کار را با به حداکثر رساندن ضریب همبستگی یا CCC انجام می دهد. این اندازه گیری آماری چگونگی سقوط جفت اعداد را در امتداد خط ۴۵ درجه در یک نمودار پراکنده ارزیابی می کند و هم دقت (چقدر فشرده است خوشه نقاط) و هم دقت (چقدر به آن خط نزدیک هستند) را منعکس می کند. رویکردهای سنتی، از جمله روش حداقل مربعات پرکاربرد، به طور کلی سعی در کاهش میانگین خطا دارند. کیم، استادیار ریاضیات، میگوید در حالی که در بسیاری از موارد مؤثر است، این روشها زمانی که هدف اصلی ایجاد یک توافق قوی بین پیشبینیها و مقادیر واقعی باشد، میتوانند نتیجه را از دست بدهند.
کیم توضیح میدهد: «گاهی اوقات ما نمیخواهیم که پیشبینیهای ما به یکدیگر نزدیک باشد، بلکه میخواهیم آنها با ارزشهای واقعی مطابقت داشته باشند. “سوال این است که چگونه میتوانیم تناسب دو شی را به روش علمی معنیدار توصیف کنیم؟ یکی از راههای مفهومسازی این است که نقاط چقدر نزدیک به یک خط ۴۵ درجه در یک نمودار پراکنده بین مقدار پیشبینیشده و مقادیر واقعی تراز شدهاند. بنابراین، اگر نمودار پراکندگی آنها همترازی قوی با آن ۴۵ درجه را نشان دهد، میتوانیم بگوییم که یک سطح مناسب بین خط ۴۵ درجه وجود دارد.”
چرا توافق مهمتر از همبستگی ساده است؟
به گفته کیم، مردم اغلب با شنیدن کلمه توافق برای اولین بار به ضریب همبستگی پیرسون فکر می کنند، زیرا این ضریب در اوایل آموزش آمار معرفی شد و یک ابزار اساسی باقی می ماند. روش پیرسون قدرت رابطه خطی بین دو متغیر را اندازه گیری می کند، اما به طور خاص بررسی نمی کند که آیا این رابطه با خط ۴۵ درجه همسو است یا خیر. کیم میگوید که میتواند همبستگیهای قوی را برای خطوطی با شیب ۵۰ درجه یا ۷۵ درجه تشخیص دهد، برای مثال، تا زمانی که نقاط داده نزدیک به یک خط مستقیم باشند.
“در مورد ما، ما به طور خاص علاقه مند به تراز کردن با یک خط ۴۵ درجه هستیم. برای این، از یک متریک متفاوت استفاده می کنیم: ضریب همبستگی برازش، که توسط لین در سال ۱۹۸۹ معرفی شد. این معیار به طور خاص بر روی میزان همسویی داده ها با یک خط ۴۵ درجه تمرکز می کند. آنچه که ما ایجاد کرده ایم یک ابزار تخمینی است که برای حداکثر کردن مقادیر برازش طراحی شده است.”
تست MALP با اسکن چشم و اندازه گیری بدن
برای ارزیابی میزان عملکرد MALP، تیم آزمایش هایی را با استفاده از داده های شبیه سازی شده و اندازه گیری های واقعی، از جمله اسکن چشم و ارزیابی چربی بدن انجام داد. در یک مطالعه، MALP بر روی دادههای یک پروژه چشمپزشکی که دو نوع دستگاه توموگرافی انسجام نوری (OCT) را با هم مقایسه میکند، استفاده شد: Stratus OCT قدیمیتر و Cirrus OCT جدیدتر. با انتقال مراکز پزشکی به سیستم سیروس، پزشکان به روشی قابل اعتماد برای ترجمه اندازه گیری ها نیاز دارند تا بتوانند نتایج را در طول زمان مقایسه کنند. محققان با استفاده از تصاویر با کیفیت بالا از ۲۶ چشم چپ و ۳۰ چشم راست، بررسی کردند که MALP چگونه میتواند خوانش Stratus OCT را از اندازهگیریهای Cirrus OCT پیشبینی کند و عملکرد آن را با روش حداقل مربعات مقایسه کردند. در حالی که MALP تخمینهایی را تولید کرد که با مقادیر واقعی Stratus مطابقت داشتند، حداقل مربعات در کاهش میانگین خطا کمی بهتر از MALP عمل کردند و تعادل بین توافق و به حداقل رساندن خطا را برجسته کردند.
این تیم همچنین دادههای چربی بدن، از جمله وزن، اندازه شکم و سایر اندازهگیریهای بدن را از ۲۵۲ بزرگسال بررسی کردند. اندازه گیری مستقیم درصد چربی بدن، مانند توزین زیر آب، قابل اعتماد اما گران است، بنابراین اغلب از اندازه گیری های ساده تر استفاده می شود. برای تخمین درصد چربی بدن از MALP استفاده شد و بر اساس روش حداقل مربعات ارزیابی شد. نتایج مشابه مطالعه اسکن چشم بود: MALP تخمینهایی ارائه کرد که با مقادیر واقعی مطابقت بیشتری داشت، در حالی که حداقل مربعات مجدداً میانگین خطاهای کمی کمتر داشتند. این الگوی مکرر بر تعادل مداوم بین توافق و به حداقل رساندن خطا تأکید داشت.
انتخاب ابزار مناسب برای کار مناسب
کیم و همکاران مشاهده کردند که MALP اغلب پیشبینیهایی را ارائه میکند که با دادههای واقعی به طور مؤثرتری نسبت به تکنیکهای استاندارد مطابقت دارد. با این حال، آنها خاطرنشان می کنند که محققان باید بین MALP و روش های سنتی تر بر اساس اولویت های خاص خود یکی را انتخاب کنند. هنگامی که کاهش خطای کلی هدف اصلی است، روش های ایجاد شده هنوز عملکرد خوبی دارند. وقتی تاکید بر پیشبینیهایی است که تا حد امکان به نتایج واقعی نزدیک هستند، MALP به طور کلی گزینه قویتری است.
تأثیر بالقوه این کار به بسیاری از زمینه های علمی می رسد. ابزارهای پیشبینی بهبود یافته میتواند به نفع پزشکی، بهداشت عمومی، اقتصاد و مهندسی باشد. برای محققانی که بر پیشبینیها تکیه میکنند، MALP یک جایگزین امیدوارکننده ارائه میکند، بهویژه زمانی که دستیابی به توافق نزدیک با نتایج دنیای واقعی مهمتر از کاهش میانگین تفاوت بین مقادیر پیشبینیشده و مشاهدهشده است.
کیم می گوید: «ما باید تحقیقات بیشتری انجام دهیم. “در حال حاضر تنظیمات ما در کلاس برآوردگرهای خطی است. این مجموعه به اندازهای بزرگ است که بتوان از آن در حوزههای مختلف استفاده کرد، اما از نظر ریاضی هنوز محدود است. بنابراین ما میخواهیم این را به کلاس عمومی تعمیم دهیم، بنابراین هدف ما حذف بخش خطی و در نتیجه تبدیل شدن به برآوردگر حداکثر توافق است.”