۳ سوال: چگونه به دانش آموزان کمک کنیم تعصبات احتمالی را در خوشه های داده هوش مصنوعی تشخیص دهند | اخبار MIT

3 سوال: چگونه به دانش آموزان کمک کنیم تعصبات احتمالی را در خوشه های داده هوش مصنوعی تشخیص دهند | اخبار MIT
فهرست مطالب

هر ساله ، هزاران دانش آموز درس می گیرند که به پزشکان می آموزد که چگونه مدل های هوش مصنوعی را مستقر کنند که می تواند به پزشکان در تشخیص و شناسایی درمان های مناسب کمک کند. با این حال ، بسیاری از این دوره ها از یک عنصر مهم پرش می کنند: آموزش دانش آموزان برای تشخیص نقص در داده های آموزشی مورد استفاده برای توسعه مدل ها.

لئو آنتونی سلی ، دانشمند ارشد تحقیقات در موسسه مهندسی پزشکی و علوم پزشکی MIT ، پزشک مرکز پزشکی بث اسرائیل و استاد دانشکده پزشکی هاروارد است. مقاله جدید و او امیدوار است که توسعه دهندگان دوره را متقاعد کند تا به دانشجویان آموزش دهند تا قبل از اینکه آنها را در مدل های خود بگنجانند ، داده های خود را به طور جامع تر ارزیابی کنند. بسیاری از مطالعات قبلی نشان داده اند که مدلهای آموزش داده شده بر روی داده های بالینی از مردان سفید پوست هنگام استفاده از افراد دیگر از گروه های دیگر به خوبی کار نمی کنند. در اینجا ، CELI تأثیر این پیش داوری و اینکه چگونه مربیان می توانند این کار را در آموزه های خود در مورد مدل های هوش مصنوعی انجام دهند ، توضیح می دهد.

س: پیش داوری چگونه می توان این خوشه های داده را وارد کرد و چگونه می توان این کمبودها را انجام داد؟

الف: هر مشکلی در داده ها برای هر مدل سازی داده ها پخته می شود. در گذشته ، ما ابزار و دستگاه هایی را شناسایی کرده ایم که در بین افراد خوب کار نمی کنند. به عنوان نمونه ، ما دریافتیم که اکسومتر پالس سطح اکسیژن را برای رنگ افراد پیش بینی می کند ، زیرا افراد رنگی کافی در کار بالینی دستگاه ها ثبت نشده اند. ما به دانش آموزان خود یادآوری می کنیم که وسایل پزشکی و تجهیزات در مردان جوان سالم بهینه شده اند. آنها هرگز برای یک زن ۸۰ ساله با نارسایی قلبی بهینه نشده اند ، اما ما از آنها برای این اهداف استفاده می کنیم. و FDA نیازی به دستگاهی ندارد تا روی این جمعیت مختلفی که از آنها استفاده خواهیم کرد خوب کار کند. تمام آنچه آنها نیاز دارند اثبات این است که آنها روی مسائل سالم کار می کنند.

علاوه بر این ، از سیستم ضبط سلامت الکترونیکی نمی توان به عنوان بلوک های ساختمانی AI استفاده کرد. این سوابق به عنوان یک سیستم یادگیری طراحی نشده اند و بنابراین شما واقعاً باید به استفاده از سوابق بهداشت الکترونیکی توجه کنید. سیستم ضبط سلامت الکترونیکی تغییر خواهد کرد ، اما این به زودی اتفاق نمی افتد ، بنابراین ما باید باهوش تر باشیم. مهم نیست که چقدر بد است ، ما باید در استفاده از داده هایی که در حال حاضر داریم خلاق تر باشیم.

روشی امیدوارکننده که ما کشف کردیم ، مدل ترانسفورماتور از جمله نتایج آزمایش آزمایشگاهی ، اما محدود به داده های سوابق سلامت الکترونیکی عددی نیست. مدل سازی رابطه اساسی بین آزمایشات آزمایشگاهی ، علائم حیاتی و درمانها ممکن است اثر داده های مفقود شده را در نتیجه عوامل تعیین کننده اجتماعی تعصبات ضمنی ارائه دهنده کاهش دهد.

س: چرا مهم است که دوره های هوش مصنوعی تعصبات احتمالی را پوشش دهند؟ با تجزیه و تحلیل محتوای چنین دوره هایی ، چه چیزی پیدا کردید؟

الف: دوره ما در MIT در سال ۲۰۱۶ آغاز شد و در بعضی مواقع ، وقتی داده هایی که ما استفاده می کنیم پر از مشکلاتی است که مردم از آن آگاه نیستند ، فهمیدیم که مردم را ترغیب می کنیم تا مدل های بیش از حد از اندازه گیری آماری عملکرد مدل را ایجاد کنند. سپس تعجب کردیم: این مشکل چقدر مشترک است؟

شک ما این بود که اگر به دوره ها یا دوره های آنلاین که برنامه درسی آنلاین است نگاه کنید ، زحمت نمی کشید که به دانشجویان بگویید که باید در مورد داده ها پارانوئید باشند. و وقتی به دوره های مختلف آنلاین نگاه می کنیم ، همه چیز در مورد ایجاد مدل. چگونه مدل را ایجاد می کنید؟ چگونه داده ها را تجسم می کنید؟ ما دریافتیم که ۱۱ دوره ای که مورد بررسی قرار داده ایم فقط پنج مورد از خوشه های داده را شامل می شود و فقط دو مورد از آنها حاوی یک بحث مهم در مورد تعصب هستند.

با این حال ، ما نمی توانیم ارزش این دوره ها را کاهش دهیم. من داستانهای زیادی را شنیده ام که افراد روی دوره های آنلاین خود کار می کنند ، اما در عین حال ، با توجه به اینکه چقدر مؤثر هستند ، چقدر مؤثر هستند ، ما واقعاً باید آنها را برای این افراد چندگانه اجباری کنیم که مجموعه های مهارت درست را آموزش دهند زیرا آنها به این افراد چندگانه کشیده می شوند. برای همکاری با هوش مصنوعی ، مهم است که مردم واقعاً خود را به آژانس تجهیز کنند. ما امیدواریم که این مقاله اکنون به شکلی که ما به دانش آموزان خود آموزش می دهیم ، در این شکاف بزرگ مورد توجه قرار گیرد.

س: توسعه دهندگان دوره چه نوع محتوا باید داشته باشند؟

الف: اول ، در ابتدا یک لیست چک از سوالات به آنها می دهد. این داده ها از کجا آمده اند؟ ناظران چه کسی بود؟ پزشکان و پرستاران چه کسانی را جمع آوری می کردند؟ و سپس در مورد دیدگاه این مؤسسات برخی از آنها را بیاموزید. اگر این یک پایگاه داده YBU باشد ، آنها باید بپرسند که چه کسی به YBU انجام داده است و چه کسی YBU را انجام نداده است ، زیرا این قبلاً نمونه ای از انتخابات را به ارمغان می آورد. اگر همه بیماران اقلیت برای YBU قابل قبول نباشند ، اگر به موقع نتوانند به ICU برسند ، مدل ها برای آنها کار نمی کنند. در واقع ، به نظر من ، ۵۰ درصد از محتوای دوره باید درک کند که آیا داده ها بیشتر نیستند ، زیرا مدل سازی پس از درک داده ها آسان است.

از سال ۲۰۱۴ ، کنسرسیوم داده های بحرانی MIT در حال سازماندهی Datathons (داده های “Hackathons”) در سراسر جهان است. در این جلسات ، پزشکان ، پرستاران ، سایر کارکنان مراقبت های بهداشتی و دانشمندان داده سعی می کنند از طریق بانکهای اطلاعاتی از طریق پایگاه داده ها کمرنگ شوند و سلامت و بیماری را در زمینه محلی بررسی کنند. کتابهای درسی و مقالات مجله ، بیماری ها را بر اساس مشاهدات و مقاله های حاوی جمعیتی باریک از کشورهای دارای منابع تحقیقاتی ارائه می دهند.

اکنون هدف اصلی ما آموزش مهارتهای تفکر انتقادی است. و مؤلفه اصلی تفکر انتقادی این است که افرادی را با گذشته های مختلف جمع کنیم.

شما نمی توانید تفکر انتقادی را در یک اتاق پر از مدیر عاملان یا اتاقی پر از پزشک آموزش دهید. محیط آنجا نیست. وقتی ما دیتاتانس داریم ، حتی لازم نیست به آنها بیاموزیم که چگونه تفکر انتقادی را انجام می دهید. به محض اینکه مردم مخلوط مناسب را به وجود می آورند – این نه تنها از پیشینه های مختلف ، بلکه از نسل های مختلف ناشی می شود – حتی لازم نیست به آنها بگویید که چگونه با انتقادی فکر کنند. این فقط اتفاق می افتد محیط برای چنین اندیشه ای صادق است. بنابراین ، برای شرکت کنندگان و دانشجویان ما ، لطفاً ، لطفاً ، که شما واقعاً درک نمی کنید که چگونه داده ها ظاهر می شوند ، کدام بیماران وارد پایگاه داده می شوند ، کدام دستگاه ها برای اندازه گیری استفاده می شود و آیا این دستگاه ها به طور مداوم در بین افراد صحیح هستند؟

هنگامی که ما در جهان فعالیت هایی داریم ، آنها را ترغیب می کنیم تا خوشه های داده محلی را جستجو کنند ، بنابراین آنها هستند. مقاومت وجود دارد زیرا آنها می دانند که مجموعه داده های بد چگونه کشف می شود. ما می گوییم این خوب است. اینگونه است که شما آن را برطرف می کنید. اگر نمی دانید چقدر بد هستند ، به جمع آوری آنها به روشی بسیار بد ادامه خواهید داد و آنها بی فایده هستند. باید اعتراف کنید که برای اولین بار نمی توانید این کار را درست انجام دهید ، و این بسیار خوب است. MIMIC (اطلاعات پزشکی مشخص شده برای پایگاه داده مراقبت های ویژه ساخته شده در مرکز پزشکی Deaconess Beth Israel) ده سال بدون یک طرح خوب طول کشید و ما فقط یک طرح خوب داریم زیرا مردم به ما گفتند که MIMIC چقدر بد است.

ما ممکن است نتوانیم به همه این سؤالات پاسخ دهیم ، اما مردم می توانند چیزی را بیدار کنند که به آنها کمک می کند تا درک کنند که مشکلات زیادی در مورد داده ها وجود دارد. من همیشه از پخش وبلاگ از افرادی که به یک Datathon پیوسته اند بسیار هیجان زده ام و می گویم دنیای آنها تغییر کرده است. اکنون آنها از فضا بیشتر هیجان زده می شوند ، زیرا متوجه پتانسیل فوق العاده ای می شوند ، اما اگر این کار را به درستی انجام ندهند ، خطر آسیب های عظیم را نیز درک می کنند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *