مدل پیش‌بینی آب و هوا NeuralGCM

مدل‌سازی دقیق آب و هوا و تغییرات اقلیمی، نقشی حیاتی در درک الگوهای آب و هوایی، مقابله با تغییرات اقلیمی و سایر پدیده‌های حیاتی کره زمین دارد. در این مسیر، مدل NeuralGCM به عنوان ابزاری قدرتمند با تلفیق هوش مصنوعی و شبیه سازی‌های پیشرفته، پا به عرصه گذاشته است.

حالا گوگل با انتشار محصول متن‌باز دینوسور (Dinosaur) بنظر تغییر مهمی در خصوص پیش‌بینی آب و هوا با استفاده از هوش‌مصنوعی و اصول فیزیک شروع کرده. اینجا خلاصه‌ای در مورد NeuralGCM و JAX و XLA به زبان ساده و با استفاده از Google Gemini نوشتم.

یادداشت‌های دیگرم در مورد آب و هوا در چند سال گذشته:

NeuralGCM چیست و چگونه کار می کند؟

NeuralGCM هسته‌ای دینامیکی طیفی است که قلب تپنده مدل‌های پیش بینی آب و هوای جهانی به شمار می رود. این مدل با زبان برنامه نویسی JAX که به پردازش‌های عددی با کارایی بالا شهرت دارد، نوشته شده است. همچنین، برای دستیابی به سرعت و دقت بی نظیر، از توان پردازشی سخت‌افزارهای پیشرفته‌ای مانند کارت‌های گرافیک (GPU) و واحدهای پردازش تنسور (TPU) بهره می برد.

قابلیت‌های کلیدی NeuralGCM:

حل معادلات متنوع جوی: این مدل توانایی حل معادلات آب کم عمق و معادلات اولیه (در حالت مرطوب و خشک) را بر روی مختصات سیگما داراست و انعطاف پذیری بالایی را برای سناریوهای مختلف مدل سازی ارائه می دهد.
تمایزپذیری خودکار: با استفاده از قابلیت های تمایزپذیری خودکار JAX، NeuralGCM می تواند به طور موثر گرادیان ها را محاسبه کند که برای کارهایی مانند بهینه سازی و تعیین کمیت عدم قطعیت ضروری است.
عملکرد سریع: بهره گیری از قدرت سخت افزارهای شتاب دهنده، افزایش قابل توجهی در عملکرد NeuralGCM به ارمغان می آورد و به محققان این امکان را می دهد تا شبیه سازی های پیچیده را با سرعت بیشتری اجرا کنند.

کاربردهای NeuralGCM در پیش‌بینی آب و هوا:

پیش‌بینی هواشناسی: با گنجاندن NeuralGCM در مدل‌های پیش‌بینی عددی هواشناسی، محققان می توانند به طور بالقوه دقت پیش بینی و زمان پیشروی را بهبود بخشند.
مدل سازی اقلیم: مطالعه روندهای بلندمدت اقلیمی و پیش بینی تغییرات آینده مستلزم ابزارهای مدل سازی قدرتمندی مانند NeuralGCM است.
درک فرآیندهای جوی: از NeuralGCM می‌توان برای بررسی پدیده‌های مختلف جوی، از آشفتگی‌های مقیاس کوچک تا الگوهای گردش مقیاس بزرگ استفاده کرد.

مقایسه با روش های سنتی:

پیش بینی آب و هوا: برای پیش بینی‌های 1 تا 10 روزه، NeuralGCM با مدل‌های یادگیری ماشین رقابت می کند و برای پیش بینی‌های 1 تا 15 روزه با پیش‌بینی گروهی مرکز پیش‌بینی میان مدت هواشناسی اروپا برابری می کند.
مدل سازی اقلیم: با دمای سطح دریا، NeuralGCM می تواند معیارهای اقلیمی مانند میانگین جهانی دما را برای چندین دهه به طور دقیق ردیابی کند و پیش بینی‌های اقلیمی با رزولوشن 140 کیلومتری پدیده‌های نوظهوری مانند فرکانس و مسیرهای واقع گرایانه طوفان‌های حاره‌ای را نشان می‌دهد.
صرفه جویی در محاسبات: در مقایسه با مدل‌های جوی مرسوم، رویکرد NeuralGCM صرفه جویی قابل توجهی در محاسبات در هر دو زمینه آب و هوا و اقلیم ارائه می‌دهد.

شبیه‌سازی چرخه‌های فصلی و پدیده‌‌های غیرمنتظره:

علاوه بر پیش بینی‌های دقیق آب و هوایی، NeuralGCM توانایی قابل توجهی در شبیه‌سازی چرخه‌های فصلی و پدیده‌های غیرمنتظره نیز دارد. این قابلیت‌ها نشان می دهد که مدل می‌تواند فرایندهای پیچیده طبیعی را بدون برنامه نویسی صریح یاد بگیرد و بازتولید کند.

ارزیابی چرخه‌های فصلی: برای سنجش عملکرد NeuralGCM در برابر تغییرات فصلی، شبیه سازی‌هایی دو ساله با 37 نقطه شروع مختلف در سال 2019 انجام شد. این شبیه سازی‌ها به ارزیابی ثبات و سازگاری مدل در طول یک چرخه سالانه کامل کمک می کند. نتایج با داده‌های واقعی از تحلیل مجدد ERA5 و حتی یک مدل پیشرفته شبیه‌سازی ابرهای جهانی (X-SHiELD) مقایسه شده است:

NeuralGCM تغییرات درجه حرارت متوسط جهانی را با دقت بالایی شبیه‌سازی می کند، به طوری که با مشاهدات ERA5 همخوانی دارد. این موضوع در نمودار مربوط به تغییرات دمای جهانی در طول سال 2020 مشهود است.
مدل، معیارهای کلیدی فصلی مانند چرخه سالانه رطوبت قابل بارش کل زمین و انرژی جنبشی کل را به خوبی برآورد می کند.
NeuralGCM دینامیک ضروری جوی مانند گردش هادلی و باد زونال میانگین، الگوهای فصلی انرژی جنبشی گردابی و رفتار گردش مونسونی را شبیه سازی می کند.
مقایسه با مدل های با رزولوشن بالا:
عملکرد NeuralGCM با X-SHiELD که به دلیل رزولوشن بالا در شبیه سازی چرخه هیدرولوژیکی پیشرو است، مقایسه شد. حتی با رزولوشن پایین تر، NeuralGCM در موارد زیر عملکرد بهتری نشان داد:
- رطوبت قابل بارش جهانی: میزان خطای سالانه NeuralGCM بسیار کمتر از X-SHiELD و حتی اقلیم شناسی بود.
- خطای دما: NeuralGCM دارای خطای دمای کمتری در تروپوسفر بالایی و پایینی نسبت به X-SHiELD بود.
- پدیده های غیرمنتظره – طوفان‌های حاره‌ای:
- با شبیه‌سازی واقع‌گرایانه مسیرها و تعداد طوفان‌های حاره‌ای، NeuralGCM توانایی خود را در درک پدیده‌های پیچیده بدون برنامه نویسی مستقیم به نمایش می‌گذارد. حتی با رزولوشن پایین‌تر، این مدل تعداد و مسیرهای درستی از طوفان‌های حاره‌ای را نسبت به داده‌های ERA5 تولید کرد. در مقابل، X-SHiELD هنگام تنظیم مجدد به همان رزولوشن، تعداد طوفان‌ها را به طور قابل توجهی دست کم گرفت.

توانایی NeuralGCM در شبیه‌سازی دقیق چرخه‌های فصلی و پدیده‌های غیرمنتظره مانند طوفان‌های حاره‌ای، پتانسیل آن را برای مدل‌سازی قابل اعتماد اقلیم برجسته می‌کند. این رویکرد ترکیبی که هوش مصنوعی و اصول مبتنی بر فیزیک را با هم ادغام می کند، مسیر امیدوارکننده‌ای برای درک و پیش‌بینی تغییرات آب و هوایی آینده ارائه می دهد.

JAX: کتابخانه قدرتمند محاسبات عددی برای تحقیقات پیشرفته یادگیری ماشین

در دنیای تحقیقاتِ یادگیری ماشین، سرعت و کارایی محاسبات از اهمیت بالایی برخوردار است. JAX یک کتابخانه جدید و قدرتمند است که با هدف رفع این نیاز و تسریع فرآیند تحقیقات و توسعه الگوریتم‌ها و مدل‌های یادگیری ماشین بوجود آمده است. جَکس، برپایه کتابخانه محبوب NumPy ساخته شده است. با این حال، قابلیت های JAX بسیار فراتر از NumPy است. JAX امکان استفاده از محاسبات عددی بر روی پردازنده‌های مرکزی (CPU)، پردازنده‌های گرافیکی (GPU) و واحدهای پردازش تنسور (TPU) را با نهایت کارایی فراهم می کند.

ویژگی‌های کلیدی JAX:

تمایزپذیری خودکار (Auto differentiation): JAX قادر است به صورت خودکار مشتق توابع نوشته شده به زبان پایتون و NumPy را محاسبه کند. این قابلیت به ویژه برای بهینه سازی مدل های یادگیری ماشین حیاتی است.
پشتیبانی از انواع مختلف حلقه ها و ساختارهای کنترلی: JAX می تواند مشتق توابعی که شامل حلقه ها، شرطی ها، فراخوانی های توابع دیگر و حتی مشتق گیری های پی در پی هستند را محاسبه کند.
پشتیبانی از تمایزپذیری به روش مستقیم (forward mode) و معکوس (reverse mode): JAX هر دو روش تمایزپذیری را در اختیار کاربر قرار می دهد که بسته به نوع مسئله کاربردهای متفاوتی دارند.
استفاده از XLA برای تسریع محاسبات: JAX از ابزار بهینه سازی کامپایلر به نام XLA بهره می برد تا کدهای NumPy را به صورت بهینه بر روی سخت افزارهای شتاب دهنده اجرا کند. این قابلیت منجر به افزایش قابل توجه سرعت محاسبات نسبت به کتابخانه های سنتی مانند NumPy می شود.

XLA: کامپایلر متن باز با تمرکز بر یادگیری ماشین برای تسریع محاسبات

XLA (Accelerated Linear Algebra) یک کامپایلر متن باز برای یادگیری ماشین است که در هسته مدل‌هایی مانند NeuralGCM کاربرد دارد. این کامپایلر مدل‌هایی که با چارچوب‌های محبوبی مثل PyTorch، TensorFlow و JAX ساخته‌شده‌اند را دریافت کرده و برای اجرا با کارایی بالا روی سخت‌افزارهای مختلف از جمله پردازنده‌های گرافیکی (GPU)، پردازنده‌های مرکزی (CPU) و شتاب دهنده‌های یادگیری ماشین (ML Accelerator) بهینه‌سازی می کند. به عنوان مثال، در یک آزمون مدل‌سازی به روش BERT که توسط MLPerf برگزار شد، استفاده از XLA با 8 کارت گرافیک Volta V100 منجر به بهبود 7 برابری در عملکرد و 5 برابری در اندازه دسته (batch size) نسبت به اجرای بدون XLA روی همان سخت‌افزار شد.

پروژه OpenXLA بستر همکاری برای توسعه و بهبود XLA است که با مشارکت پیشگامان صنعت سخت افزار و نرم افزار یادگیری ماشین مانند Alibaba، Amazon Web Services، AMD، Apple، Arm، Google، Intel، Meta و NVIDIA انجام می شود. این همکاری گسترده تضمین کننده کیفیت، پشتیبانی و توسعه مداوم XLA است.

استفاده از XLA در ساخت مدل‌هایی مانند NeuralGCM مزایای مختلفی به همراه دارد، از جمله:

سرعت بالاتر: همانطور که مثال MLPerf نشان داد، XLA می تواند به طرز قابل توجهی سرعت اجرای مدل ها را افزایش دهد.
استفاده بهینه از سخت افزار: XLA با بهینه سازی کد برای سخت افزارهای خاص، بهترین استفاده را از منابع محاسباتی موجود می برد.
پشتیبانی از طیف وسیعی از سخت افزارها: XLA انعطاف پذیری بالایی داشته و قابلیت اجرا روی طیف وسیعی از سخت افزارهای مختلف را دارد.