راهنمای جامع مدل‌های هوش مصنوعی Ollama برای دفاتر اداری

کارشناس راهنما: حمید حساس
آدرس: فارس، شیراز، مرکزی
همراه: 09367147548

معرفی مدل‌های هوش مصنوعی Ollama و کاربردهای آن‌ها


       در دنیای امروز، استفاده از هوش مصنوعی (AI) به یک ضرورت برای افزایش بهره‌وری و کاهش هزینه‌ها تبدیل شده است. Ollama یک ابزار قدرتمند و متن‌باز است که به شما امکان می‌دهد مدل‌های هوش مصنوعی را به صورت آفلاین و محلی اجرا کنید. این ویژگی، Ollama را به یک راهکار ایده‌آل برای دفاتر اسناد رسمی، ازدواج و طلاق، وکلا و سایر دفاتر اداری و دانشگاه‌ها، دانشجویان، دانش آموزان و مهندسین و برنامه نویسان تبدیل می‌کند که به حفظ حریم خصوصی و امنیت داده‌ها اهمیت می‌دهند.


       اما فراتر از حفظ حریم خصوصی، اجرای آفلاین هوش مصنوعی با Ollama، وابستگی به اینترنت را به طور کامل از بین می‌برد. در شرایطی که دسترسی به اینترنت قطع است یا به دلیل محدودیت‌های پهنای باند، استفاده از سرویس‌های آنلاین هوش مصنوعی امکان‌پذیر نیست، Ollama به شما این امکان را می‌دهد که به کار خود با سرعت و بدون وقفه ادامه دهید. این موضوع برای محیط‌های حساس مانند دفاتر حقوقی که نیاز به دسترسی فوری به اطلاعات دارند، یا برای دانشجویان و دانش‌آموزانی که در مناطق با دسترسی محدود به اینترنت زندگی می‌کنند، بسیار حیاتی است.


       Ollama نه تنها امکان اجرای مدل‌های هوش مصنوعی را فراهم می‌کند، بلکه با قابلیت‌های متن‌باز خود، امکان سفارشی‌سازی و توسعه آن را نیز برای نیازهای خاص شما فراهم می‌آورد. این ابزار قدرتمند، با ارائه یک راهکار مستقل و قابل‌اعتماد، به شما کمک می‌کند تا از تمام مزایای هوش مصنوعی بهره‌مند شوید، بدون اینکه نگران قطعی اینترنت یا مسائل امنیتی باشید.

                   
مدل کاربرد اصلی نام مدل:پارامتر سیستم مورد نیاز
ChatGPT OSS توسعه‌دهنده: OpenAI
زمینه تخصصی: جایگزین شفاف برای مدل‌های GPT تجاری.
بهترین عملکرد در: مکالمات پیچیده و تولید محتوای طولانی.
مناسب برای: سازمان‌های نیازمند حریم خصوصی بالا.
gpt-oss:20b
gpt-oss:120b
خوب
عالی
DeepSeek R1 توسعه‌دهنده: DeepSeek
زمینه تخصصی: استدلال منطقی پیشرفته و حل مسائل ریاضی.
بهترین عملکرد در: تفکر زنجیره‌ای (CoT) و کدنویسی پیچیده.
مناسب برای: پژوهشگران و تحلیل‌گران داده.
deepseek-r1:1.5b
deepseek-r1:7b
deepseek-r1:8b
deepseek-r1:14b
deepseek-r1:32b
deepseek-r1:70b
deepseek-r1:671b
ضعیف
متوسط
متوسط
خوب
خوب
عالی
سرور
DeepSeek OCR توسعه‌دهنده: DeepSeek
زمینه تخصصی: تشخیص نوری کاراکترها و درک بصری اسناد.
بهترین عملکرد در: استخراج متن از جداول و تصاویر اسکن شده.
مناسب برای: اتوماسیون اداری و دیجیتالی‌سازی اسناد.
deepseek-ocr:3b متوسط
Gemma 3
(پیشنهادی)
توسعه‌دهنده: Google DeepMind
زمینه تخصصی: مدل سبک‌وزن و کارآمد برای سخت‌افزارهای محدود.
بهترین عملکرد در: تولید متن خلاقانه، ترجمه و خلاصه‌سازی و پاسخ به سوالات عمومی.
مناسب برای: نویسندگان، شاعران، مشاوران و بهترین دوست برای افراد تنها.
gemma3:1b
gemma3:4b
gemma3:12b
gemma3:27b
ضعیف
ضعیف
متوسط
خوب
Translate Gemma توسعه‌دهنده: Google DeepMind
زمینه تخصصی: ترجمه ماشینی با کیفیت بالا.
بهترین عملکرد در: حفظ لحن در ترجمه و بومی‌سازی محتوا.
مناسب برای: سیستم‌های ترجمه همزمان و تولید محتوای چندزبانه.
translategemma:4b
translategemma:12b
translategemma:27b
ضعیف
متوسط
خوب
Llama 3.1 توسعه‌دهنده: Meta
زمینه تخصصی: مدل چندمنظوره با مقیاس‌پذیری بالا.
بهترین عملکرد در: پردازش متون بسیار طولانی و دانش عمومی.
مناسب برای: چت‌بات‌های تجاری و تحلیل داده‌های حجیم.
llama3.1:8b
llama3.1:70b
llama3.1:405b
متوسط
عالی
سرور
Phi توسعه‌دهنده: Microsoft
زمینه تخصصی: مدل کوچک (SLM) با کارایی در سطح مدل‌های بزرگ.
بهترین عملکرد در: استدلال منطقی، پاسخ به سوالات متنی و پردازش روی گوشی/لپ‌تاپ ضعیف.
مناسب برای: محیط‌هایی با منابع سخت‌افزاری بسیار محدود و چت‌بات‌های سبک.
phi3:3.8b
phi3:14b
phi4:14b
ضعیف
خوب
خوب
Mistral توسعه‌دهنده: Mistral AI
زمینه تخصصی: بهره‌وری خیره‌کننده نسبت به تعداد پارامتر (مدل محبوب اروپایی).
بهترین عملکرد در: خلاصه‌سازی متون، دسته‌بندی داده‌ها و درک دستورات پیچیده.
مناسب برای: اتوماسیون فرآیندهای اداری و جایگزینی برای مدل‌های سنگین‌تر.
mistral:7b
mistral-nemo:12b
متوسط
خوب
Qwen 3 توسعه‌دهنده: Alibaba Cloud
زمینه تخصصی: هوش مصنوعی چندزبانه با تمرکز بر بازدهی بالا.
بهترین عملکرد در: درک زبان‌های مختلف و پاسخگویی به سوالات.
مناسب برای: دستیارهای هوشمند بین‌المللی در پاسخ به سوالات علمی.
qwen3:0.6b
qwen3:1.7b
qwen3:4b
qwen3:8b
qwen3:14b
qwen3:30b
qwen3:32b
qwen3:235b
ضعیف
ضعیف
متوسط
متوسط
خوب
خوب
عالی
سرور
Qwen3 Code
(پیشنهادی)
توسعه‌دهنده: Alibaba Cloud
زمینه تخصصی: تولید و تحلیل کدنویسی سریع و ابزاری.
بهترین عملکرد در: نوشتن تابع، دیباگ و مستندسازی کد به شکل بسیار سریع اما دقت در پروژه‌های بزرگ متوسط.
مناسب برای: ابزارهای توسعه نرم‌افزار (IDE). این مدل بر پایه SFT (تنظیم دقیق نظارت شده) بهینه شده است. تمرکز آن بر روی سینتکس (نحو) صحیح زبان‌های برنامه‌نویسی و سرعت بالای پاسخ‌دهی است. در واقع، این مدل بهترین گزینه برای تکمیل خودکار کد (Autocomplete) است.از حدود ۴۰ زبان برنامه‌نویسی پشتیبانی می‌کند و دانش آن محدود به مستندات رسمی است. در حل تکالیف مشخص و توابع استاندارد عالی عمل می‌کند. مثلاً: «یک تابع برای مرتب‌سازی آرایه بنویس.»
qwen3-coder:30b
qwen3-coder:480b
خوب
سرور
Qwen3 Code Next توسعه‌دهنده: Alibaba Cloud
زمینه تخصصی: تولید، تحلیل و استدلال سنگین و حل معماری در کدهای برنامه‌نویسی.
بهترین عملکرد در: نوشتن تابع، دیباگ و مستندسازی کد به شکل کند اما دقت در پروژه‌های بزرگ زیاد.
مناسب برای: ابزارهای توسعه نرم‌افزار (IDE). این نسخه از تکنولوژی Reasoning (استدلال) مشابه مدل‌های سری R1 استفاده می‌کند. قبل از نوشتن کد، مدل یک «زنجیره تفکر» (Chain of Thought) ایجاد می‌کند تا ابتدا منطق الگوریتم را تحلیل کرده و سپس کد را بنویسد. دانش عمیق‌تری از Frameworkهای مدرن و ترکیب زبان‌ها (مثلاً اتصال بهینه دیتابیس در محیط‌های Microservices) دارد و در مستندسازی کدهای ناخوانا (Legacy Code) بسیار قوی‌تر عمل می‌کند. برای چالش‌هایی طراحی شده که جواب آماده در اینترنت ندارند. این مدل می‌تواند باگ‌های منطقی بسیار پیچیده در پروژه‌های بزرگ را پیدا کند و راه‌حل‌های بهینه‌تری (از نظر مصرف حافظه و CPU) ارائه دهد.
qwen3-coder-next
qwen3-coder-next:q8_0
عالی
سرور


نیازمندی‌های سخت‌افزاری برای Ollama

قطعات ضعیف
(مدل‌های سبز)
متوسط
(مدل‌های آبی)
خوب
(مدل‌های نارنجی)
عالی
(مدل‌های قرمز)
CPU Intel Core i3/i5/i7/i9 (7-14th) Intel Core i7/i9 (10-14th) Intel Core i9 (14th) Or Core Ultra 265k/285K Core Ultra 265k/285K
RAM 8-16GB DDR4 4000Mhz CL19 16-32GB DDR4/5 5200Mhz CL22 32-64GB DDR5 7000Mhz CL32 64-128GB DDR5 9000Mhz CL36
VGA Nvidia series 1-3 6GB-12GB
(RTX1050Ti - RTX3090Ti)
Nvidia series 3-4 8GB-16GB
(RTX3060Ti - RTX4090Ti)
Nvidia series 4-5 12GB-24GB
(RTX4070Ti - RTX5070Ti)
Nvidia series 5 24GB-48GB
(RTX5080Ti - RTX5090Ti)
SSD 128GB SATA 6.0 128GB SATA 6.0 or M.2 256GB Gen3 M.2 500GB NVME Gen3-5 M.2 NVME Gen5
زمان پاسخ
به سوالات
5 الی 90 ثانیه 15 الی 120 ثانیه 30 الی 360 ثانیه 45 الی 600 ثانیه


مرکز دانلود ابزارها و مدل‌های هوش مصنوعی

🚀 آموزش راه‌اندازی سریع هوش مصنوعی در ۵ دقیقه

۱. نصب موتور اصلی

فایل OllamaSetup.exe را از جدول پایین دانلود و نصب کنید. پس از نصب، آیکون یک لاما کوچک در کنار ساعت ویندوز (Taskbar) ظاهر می‌شود.

۲. ورود به دنیای فرمان

دکمه Win + R را بزنید، تایپ کنید cmd و اینتر بزنید تا پنجره سیاه رنگ (Terminal) باز شود.

۳. فراخوانی مدل gemma3

دستور زیر را در پنجره سیاه کپی و اینتر کنید:

ollama run gemma3:12b
✅ چه اتفاقی می‌افتد؟

پس از وارد کردن دستور، سیستم به صورت خودکار شروع به دانلود مدل gemma3:12b می‌کند (فقط بار اول). پس از اتمام دانلود، شما می‌توانید مستقیماً در همان پنجره با هوش مصنوعی چت کنید.
💡 نکته: برای خروج از محیط چت، عبارت /bye را تایپ کنید.

لینک‌های دانلود نرم‌افزار (نسخه ویندوز)
نرم‌افزار Ollama 📥 دانلود مستقیم از Soft98.ir
📥 دانلود مستقیم از P30downlod.ir
📥 دانلود مستقیم Ollama
نرم‌افزار LM Studio 📥 دانلود مستقیم از Soft98.ir
📥 دانلود مستقیم از Yasdl.ir
📥 دانلود از سایت رسمی
ویژگی‌های Ollama با LM Studio
ویژگی Ollama LM Studio
هدف اصلی اجرای سریع و راحت مدل‌ها تست، بررسی و کار تخصصی با مدل
رابط کاربری ترمینال (CMD) / کدنویسی گرافیکی (پنجره و دکمه)
مصرف منابع بسیار کم و بهینه کمی بیشتر (به دلیل رابط گرافیکی)
مناسب برای... استفاده روزمره و توسعه‌دهندگان محققان و کسانی که محیط گرافیکی می‌خواهند
نصب مدل با یک دستور ساده (مثل کپسول‌های بالا) جستجو و دانلود دستی نسخه‌ها
آپلود فایل دارد دارد
اجرای مدل‌های سنگین دارد ندارد
اجرای پارامتر قابلیت اجرا بالاتر از منابع سخت افزاری
بدون محدودیت تا مدل‌های 200b را می‌توان اجرا نمود
صرفاً متناسب با منابع سخت افزاری
فقط میتوان مدل‌های سازگار تا 80b را دانلود و اجرا نمود
سرعت پاسخ سریع آهسته
دانلود مدل سریع آهسته

برای ورود به سایت اصلی Ollama و یا مشاهده هر یک از مدل‌های هوش مصنوعی حتماً باید از برنامه های تحریم‌شکن یا فیلتر‌شکن استفاده نمائید.

نام مدل هوش مصنوعی پشتیبانی از فارسی نسخه‌های موجود (برای کپی دستور، روی هر کپسول کلیک کنید) لینک منبع
Gemma 3
(پیشنهادی)
بله 1b = 0.9GB 4b = 3.3GB 12b = 8.1GB 27b = 17GB صفحه مدل
DeepSeek R1 بله 1.5b = 1.1GB 7b = 4.7GB 8b = 4.9GB 14b = 9GB 32b = 20GB 70b = 43GB 671b = 404GB صفحه مدل
ChatGPT OSS بله 20b = 14GB 120b = 65GB صفحه مدل
Llama 3.1 بله 8b = 4.9GB 70b = 43GB 405b = 243GB صفحه مدل
Phi-3 بله 3.8b = 2.2GB 14b = 7.9GB صفحه مدل
Phi-4 بله 14b = 9.1GB صفحه مدل
Mistral بله 7b = 5.6GB 12b = 7.1GB صفحه مدل
Qwen 3 بله 0.6b = 0.5GB 1.7b = 1.4GB 4b = 2.5GB 8b = 5.2GB 14b = 9.3GB 30b = 19GB 32b = 20GB 235b = 142GB صفحه مدل
Qwen 3 Coder
(پیشنهادی)
بله 30b = 19GB 480b = 290GB صفحه مدل
Qwen 3 Coder Next بله 79.7b = 52GB 79.7b = 85GB صفحه مدل

* توجه: برای دریافت مدل‌ها پس از نصب Ollama، کافیست با باز کردن cmd بصورت Run as administrator دستور ollama run [model-name] را در ترمینال اجرا کنید یا از لینک‌های فوق استفاده نمایید. مثلاً ollama run gemma3:12b

💡 توصیه‌ی فنی حیاتی:
برای اجرای روان این مدل‌ها، توصیه می‌شود از سیستم‌هایی با حداقل مشخصات سخت‌افزاری ذکر شده استفاده کنید. همچنین، به‌روزرسانی درایورهای کارت گرافیک و سیستم‌عامل می‌تواند به بهبود عملکرد کمک کند.

💡 مفهوم "B" در مدل‌های هوش مصنوعی:
حرف "B" مخفف "میلیارد" است و به تعداد پارامترهای موجود در مدل هوش مصنوعی اشاره دارد. پارامترها، متغیرهایی هستند که در طول فرآیند آموزش مدل تنظیم می‌شوند و عملکرد آن را تعیین می‌کنند. هرچه تعداد پارامترها بیشتر باشد، مدل می‌تواند اطلاعات پیچیده‌تری را یاد بگیرد و وظایف دشوارتری را انجام دهد.
به عنوان مثال، یک مدل "8B" دارای 8 میلیارد پارامتر است، در حالی که یک مدل "70B" دارای 70 میلیارد پارامتر است.

⚠️ هشدار امنیتی: به دلیل حفظ حریم خصوصی و امنیت داده‌ها، توصیه می‌شود مدل‌های هوش مصنوعی را به صورت آفلاین و محلی اجرا کنید.


پیشنهاد سیستم خانگی چندکاره

برای افرادی که قصد دارند همزمان با بازی‌های گرافیکی بالا، برنامه‌نویسی، و اجرای مدل‌های هوش مصنوعی بزرگ را در یک سیستم خانگی انجام دهند، ترکیبی از پردازنده‌ی 20 هسته‌ای Intel Core Ultra 7 265K، کارت گرافیک RTX 5070 12GB GDDR7، و حافظه‌ی 64GB DDR5 6000MHz بهترین انتخاب است. این ترکیب نه تنها در حال حاضر توان بالایی در پردازش سنگین را داراست، بلکه با قابلیت گسترش حافظه و افزودن SSD Gen 5، می‌تواند برای چند سال آینده آماده باشد.


جدول کلی مشخصات سیستم

بخش جزئیات توضیحات
مادربورد ASUS TUF GAMING Z890‑PRO WIFI مجهز به هوش مصنوعی جهت مدیریت هماهنگی قطعات و افزایش کُلاک
(16‑فاز CPU Power) - (1‑فاز iGPU) - (2‑فاز VCCSA) - (1‑فاز VNNAON)
4xDIMM DDR5 (پشتیبانی حافظه تا حداکثر 256GB)
1xM.2 PCIe Gen5 x4 | 3xM.2 PCIe Gen4 x4 | 4xSATA 6 Gb/s
1xIntel 2.5Gbps Ethernet | 1xWi‑Fi 7
پردازنده Intel Core Ultra 7 265K دارای 20 هسته (8P + 12E)
فرکانس پایه: 3.9GHz و فرکانس توسعه 5.5GHz boost
13TOPS AI NPU
31.1 ملیارد ترانزستور 3nm
کارت گرافیک ASUS Dual GeForce RTX 5070 12GB GDDR7 تعداد هسته 6144 و 5nm FinFET
فرکانس پایه 2325MHz و فرکانس توسعه یافتته 2512MHz boost
1750MHz ساعت حافظه (28Gbps مؤثر)
12GB GDDR7 192bit با باند‌ورِد 672GB/s
TMU:192 | ROP:80
حافظه رم Corsair Vengeance RGB 64GB DDR5 6000MHz CL38 Dual 64GB (2x32GB) 6000MT/s XMP III
Dual‑channel 12GB/s باند‌ورِد.
ذخیره‌سازی Samsung 970 EVO Plus 500GB (PCIe 3.0 x4) 500GB SSD با سرعت 3500/3200MB/s
خنک‌کننده Hydrogon D120 ARGB 6heat‑pipe | 2x120mm ARGB
56.23CFM | 1.98mm H₂O
1850RPM | 30.5dBA.
منبع Green GP1000B‑GXD 1000W (ATX12V) قدرت 1000W کاملاً ماژولار
83.3A 12V
22A 3.3V.


جدول برای کاربران هوش مصنوعی

جدول زیر اطلاعات مهمی از سیستم پیشنهاد شده خانگی برای کاربرانی که از هوش مصنوعی استفاده می‌خواهند نمایند را نمایش می‌دهد.

ویژگی مقدار
AI NPU (CPU) 13TOPS (FP16)
GPU Tensor Cores 192 (FP16 30.87 TFLOPS، FP32 31.24 TFLOPS)
حافظه GPU 12GB GDDR7 (672GB/s)
کاربرد FP16 30.87TFLOPS
کاربرد FP32 31.24TFLOPS
کاربرد FP64 488GFLOPS
Cache L1 128KB
Cache L2 48MB(shared)
PCIe Bandwidth 20lane Gen5 (640GB/s)
نسبه برق/عملکرد 0.08W/TFLOPS
دقت FP16 نسبت به FP32 90%≈
latency (1‑layer inference) 1ms<


رتبه بندی مدل‌های هوش مصنوعی بر اساس مد (1B‑120B)

در جدول زیر، توانایی اجرای مدل‌های مختلف هوش مصنوعی بر اساس پارامتر مد بررسی شده است.

مد (پارامتر) قابل اجرا بر
روی این سیستم؟
دلیل پیشنهاد ارتقا (در صورت لزوم)
1B ✔️ حافظه 12 GB کافی و پردازش کافی هیچ چیز
2B ✔️ حافظه کافی، CPU/AI NPU مناسب هیچ چیز
4B ✔️ حافظه کافی، کارایی بالا هیچ چیز
8B ✔️ حافظه کافی، CPU/AI NPU مناسب برای FP16 هیچ چیز
10B ✔️ حافظه 12 GB کافی، CPU/AI NPU مناسب برای FP16 هیچ چیز
12B ✔️ حافظه 12 GB، CPU/AI NPU 13 TOPS برای FP16/FP32 هیچ چیز
14B ✔️ حافظه کافی اما بار CPU/AI NPU نزدیک به حداکثر افزایش حافظه گرافیک یا AI NPU 30 TOPS
18B ✔️ حافظه گرافیک کافی، CPU/AI NPU محدود خنک‌کننده قوی‌تر و افزایش AI NPU
20B ✔️ حافظه گرافیک کافی، CPU/AI NPU کافی برای FP16 اما ممکن است دمای بالا باشد ارتقا به GPU 16GB یا افزایش AI NPU
30B ✔️ حافظه گرافیک 12 GB کافی نیست و آهسته اجرا می‌شود؛ نیاز به 16GB حافطه است GPU 16GB (RTX 5070Ti)
GPU 24GB (RTX 5080)
32B ✔️ حافظه گرافیک 12 GB کافی نیست و آهسته اجرا می‌شود؛ نیاز به حداقل 16GB حافظه است GPU 16GB (RTX 5070Ti)
GPU 24GB (RTX 5080)
48B ✔️ به درستی قابل اجرا نیست. حافظه گرافیک 12ۀB کافی نیست و آهسته اجرا می‌شود؛ نیاز به 24GB حافظه است GPU 24GB (RTX 5080)
50B به درستی قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 128GB است
حافظه گرافیک 12GB کافی نیست و بسیار آهسته اجرا می‌شود؛ نیاز به 24GB حافظه است
GPU 24GB (RTX 5080)
70B اصلاً قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 128GB است
حافظه گرافیک 12GB کافی نیست و به شدت آهسته اجرا می‌شود؛ نیاز به 48GB حافظه است
GPU 2x24GB (RTX 5080Ti)
80B اصلاً قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 128GB است
حافظه گرافیک 12GB کافی نیست و به شدت آهسته اجرا می‌شود؛ نیاز به 64GB حافظه است
GPU 2x32GB (RTX 5090Ti)
100B اصلاً قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 256GB است
مقدار 12GB حافظه گرافیک کافی نیست و حداقل 64GB حافظه نیاز دارد
استفاده همزمان از چند گرافیک
4xRTX 5070Ti 16GB (64GB)
2xRTX 5080Ti 32GB (64GB)
2xRTX 5090Ti 32GB (64GB)
120B اصلاً قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 256GB است
مقدار 12GB حافظه گرافیک کافی نیست و حداقل 64GB حافظه نیاز دارد
استفاده همزمان از چند گرافیک
4xRTX 5070Ti 16GB (64GB)
2xRTX 5080Ti 32GB (64GB)
2xRTX 5090Ti 32GB (64GB)


لیست مدل‌های مناسب و دستورات نصب

جدول زیر مدل‌های مناسب و دستورات نصب در Ollama و My‑Studio را فهرست می‌کند.

مدل توضیحات دستور نصب در Ollama دستور نصب در My‑Studio
LLaMA‑3 70B مدل 70B پارامتر، FP16 با 30 TFLOPS GPU مناسب. ollama pull llama3:70b my-studio install llama3-70b
LLaMA‑3 8B مدل 8B پارامتر، مناسب برای کاربردهای متوسط. ollama pull llama3:8b my-studio install llama3-8b
Qwen‑2 72B مدل 72B پارامتر، مناسب برای ترجمه و پردازش زبان طبیعی. ollama pull qwen2:72b my-studio install qwen2-72b
Gemma‑2 2B مدل 2B پارامتر، سبک، مصرف برق کم. ollama pull gemma2:2b my-studio install gemma2-2b
Phi‑2 مدل 2.7B پارامتر، مناسب برای کاربردهای کم مصرف. ollama pull phi-2 my-studio install phi-2
GPT‑4o‑Mini مدل 2.7B پارامتر، قدرت بالا در متن و پرسش‑پاسخ. ollama pull gpt-4o-mini my-studio install gpt-4o-mini
Mistral‑7B مدل 7B پارامتر، سبک و سریع. ollama pull mistral-7b my-studio install mistral-7b
StableLM‑Zephyr‑7B مدل 7B پارامتر، مناسب برای توسعه و تحقیقات. ollama pull stablelm-zephyr-7b my-studio install stablelm-zephyr-7b
LLaMA‑3.2 13B مدل 13B پارامتر، مناسب برای مدل‌های متوسط. ollama pull llama3.2:13b my-studio install llama32-13b


جمع بندی:این ترکیب سخت‌افزاری با پردازنده‌ی 20 هسته، کارت گرافیک 12GB GDDR7 و حافظه‌ی 64GB DDR5، برای استفاده‌های چندکاره، بازی‌های گرافیکی بالا و اجرای مدل‌های هوش مصنوعی تا 12GB طراحی شده است. با توجه به پیشرفت فناوری، انتظار می‌رود این سیستم در مدت 4-5 سال بتواند با به‌روزرسانی‌های نرم‌افزاری و سخت‌افزاری (مثلاً ارتقا SSD یا گسترش حافظه) و اضافه‌کردن کارت گرافیک 24GB-32 ، همچنان در عملکرد قابل قبول باقی بماند. در سال‌های آینده‌ی نزدیک، برای مدل‌های بزرگ‌تر (≥32B) به ارتقای حافظه گرافیک یا ترکیب چند کارت نیاز خواهد بود؛ اما برای نیازهای روزمره و متوسط، 5 سال عمر عملیاتی با مصرف انرژی معقول، تضمین می‌شود.