این صفحه برای جلوگیری از سوء استفاده، قابلیت کپی، چاپ و ذخیره ندارد.
در دنیای امروز، استفاده از هوش مصنوعی (AI) به یک ضرورت برای افزایش بهرهوری و کاهش هزینهها تبدیل شده است. Ollama یک ابزار قدرتمند و متنباز است که به شما امکان میدهد مدلهای هوش مصنوعی را به صورت آفلاین و محلی اجرا کنید. این ویژگی، Ollama را به یک راهکار ایدهآل برای دفاتر اسناد رسمی، ازدواج و طلاق، وکلا و سایر دفاتر اداری و دانشگاهها، دانشجویان، دانش آموزان و مهندسین و برنامه نویسان تبدیل میکند که به حفظ حریم خصوصی و امنیت دادهها اهمیت میدهند.
اما فراتر از حفظ حریم خصوصی، اجرای آفلاین هوش مصنوعی با Ollama، وابستگی به اینترنت را به طور کامل از بین میبرد. در شرایطی که دسترسی به اینترنت قطع است یا به دلیل محدودیتهای پهنای باند، استفاده از سرویسهای آنلاین هوش مصنوعی امکانپذیر نیست، Ollama به شما این امکان را میدهد که به کار خود با سرعت و بدون وقفه ادامه دهید. این موضوع برای محیطهای حساس مانند دفاتر حقوقی که نیاز به دسترسی فوری به اطلاعات دارند، یا برای دانشجویان و دانشآموزانی که در مناطق با دسترسی محدود به اینترنت زندگی میکنند، بسیار حیاتی است.
Ollama نه تنها امکان اجرای مدلهای هوش مصنوعی را فراهم میکند، بلکه با قابلیتهای متنباز خود، امکان سفارشیسازی و توسعه آن را نیز برای نیازهای خاص شما فراهم میآورد. این ابزار قدرتمند، با ارائه یک راهکار مستقل و قابلاعتماد، به شما کمک میکند تا از تمام مزایای هوش مصنوعی بهرهمند شوید، بدون اینکه نگران قطعی اینترنت یا مسائل امنیتی باشید.
| مدل | کاربرد اصلی | نام مدل:پارامتر | سیستم مورد نیاز |
|---|---|---|---|
| ChatGPT OSS |
توسعهدهنده: OpenAI زمینه تخصصی: جایگزین شفاف برای مدلهای GPT تجاری. بهترین عملکرد در: مکالمات پیچیده و تولید محتوای طولانی. مناسب برای: سازمانهای نیازمند حریم خصوصی بالا. |
gpt-oss:20b gpt-oss:120b |
خوب عالی |
| DeepSeek R1 |
توسعهدهنده: DeepSeek زمینه تخصصی: استدلال منطقی پیشرفته و حل مسائل ریاضی. بهترین عملکرد در: تفکر زنجیرهای (CoT) و کدنویسی پیچیده. مناسب برای: پژوهشگران و تحلیلگران داده. |
deepseek-r1:1.5b deepseek-r1:7b deepseek-r1:8b deepseek-r1:14b deepseek-r1:32b deepseek-r1:70b deepseek-r1:671b |
ضعیف متوسط متوسط خوب خوب عالی سرور |
| DeepSeek OCR |
توسعهدهنده: DeepSeek زمینه تخصصی: تشخیص نوری کاراکترها و درک بصری اسناد. بهترین عملکرد در: استخراج متن از جداول و تصاویر اسکن شده. مناسب برای: اتوماسیون اداری و دیجیتالیسازی اسناد. |
deepseek-ocr:3b | متوسط |
| Gemma 3 (پیشنهادی) |
توسعهدهنده: Google DeepMind زمینه تخصصی: مدل سبکوزن و کارآمد برای سختافزارهای محدود. بهترین عملکرد در: تولید متن خلاقانه، ترجمه و خلاصهسازی و پاسخ به سوالات عمومی. مناسب برای: نویسندگان، شاعران، مشاوران و بهترین دوست برای افراد تنها. |
gemma3:1b gemma3:4b gemma3:12b gemma3:27b |
ضعیف ضعیف متوسط خوب |
| Translate Gemma |
توسعهدهنده: Google DeepMind زمینه تخصصی: ترجمه ماشینی با کیفیت بالا. بهترین عملکرد در: حفظ لحن در ترجمه و بومیسازی محتوا. مناسب برای: سیستمهای ترجمه همزمان و تولید محتوای چندزبانه. |
translategemma:4b translategemma:12b translategemma:27b |
ضعیف متوسط خوب |
| Llama 3.1 |
توسعهدهنده: Meta زمینه تخصصی: مدل چندمنظوره با مقیاسپذیری بالا. بهترین عملکرد در: پردازش متون بسیار طولانی و دانش عمومی. مناسب برای: چتباتهای تجاری و تحلیل دادههای حجیم. |
llama3.1:8b llama3.1:70b llama3.1:405b |
متوسط عالی سرور |
| Phi |
توسعهدهنده: Microsoft زمینه تخصصی: مدل کوچک (SLM) با کارایی در سطح مدلهای بزرگ. بهترین عملکرد در: استدلال منطقی، پاسخ به سوالات متنی و پردازش روی گوشی/لپتاپ ضعیف. مناسب برای: محیطهایی با منابع سختافزاری بسیار محدود و چتباتهای سبک. |
phi3:3.8b phi3:14b phi4:14b |
ضعیف خوب خوب |
| Mistral |
توسعهدهنده: Mistral AI زمینه تخصصی: بهرهوری خیرهکننده نسبت به تعداد پارامتر (مدل محبوب اروپایی). بهترین عملکرد در: خلاصهسازی متون، دستهبندی دادهها و درک دستورات پیچیده. مناسب برای: اتوماسیون فرآیندهای اداری و جایگزینی برای مدلهای سنگینتر. |
mistral:7b mistral-nemo:12b |
متوسط خوب |
| Qwen 3 |
توسعهدهنده: Alibaba Cloud زمینه تخصصی: هوش مصنوعی چندزبانه با تمرکز بر بازدهی بالا. بهترین عملکرد در: درک زبانهای مختلف و پاسخگویی به سوالات. مناسب برای: دستیارهای هوشمند بینالمللی در پاسخ به سوالات علمی. |
qwen3:0.6b qwen3:1.7b qwen3:4b qwen3:8b qwen3:14b qwen3:30b qwen3:32b qwen3:235b |
ضعیف ضعیف متوسط متوسط خوب خوب عالی سرور |
| Qwen3 Code (پیشنهادی) |
توسعهدهنده: Alibaba Cloud زمینه تخصصی: تولید و تحلیل کدنویسی سریع و ابزاری. بهترین عملکرد در: نوشتن تابع، دیباگ و مستندسازی کد به شکل بسیار سریع اما دقت در پروژههای بزرگ متوسط. مناسب برای: ابزارهای توسعه نرمافزار (IDE). این مدل بر پایه SFT (تنظیم دقیق نظارت شده) بهینه شده است. تمرکز آن بر روی سینتکس (نحو) صحیح زبانهای برنامهنویسی و سرعت بالای پاسخدهی است. در واقع، این مدل بهترین گزینه برای تکمیل خودکار کد (Autocomplete) است.از حدود ۴۰ زبان برنامهنویسی پشتیبانی میکند و دانش آن محدود به مستندات رسمی است. در حل تکالیف مشخص و توابع استاندارد عالی عمل میکند. مثلاً: «یک تابع برای مرتبسازی آرایه بنویس.» |
qwen3-coder:30b qwen3-coder:480b |
خوب سرور |
| Qwen3 Code Next |
توسعهدهنده: Alibaba Cloud زمینه تخصصی: تولید، تحلیل و استدلال سنگین و حل معماری در کدهای برنامهنویسی. بهترین عملکرد در: نوشتن تابع، دیباگ و مستندسازی کد به شکل کند اما دقت در پروژههای بزرگ زیاد. مناسب برای: ابزارهای توسعه نرمافزار (IDE). این نسخه از تکنولوژی Reasoning (استدلال) مشابه مدلهای سری R1 استفاده میکند. قبل از نوشتن کد، مدل یک «زنجیره تفکر» (Chain of Thought) ایجاد میکند تا ابتدا منطق الگوریتم را تحلیل کرده و سپس کد را بنویسد. دانش عمیقتری از Frameworkهای مدرن و ترکیب زبانها (مثلاً اتصال بهینه دیتابیس در محیطهای Microservices) دارد و در مستندسازی کدهای ناخوانا (Legacy Code) بسیار قویتر عمل میکند. برای چالشهایی طراحی شده که جواب آماده در اینترنت ندارند. این مدل میتواند باگهای منطقی بسیار پیچیده در پروژههای بزرگ را پیدا کند و راهحلهای بهینهتری (از نظر مصرف حافظه و CPU) ارائه دهد. |
qwen3-coder-next qwen3-coder-next:q8_0 |
عالی سرور |
| قطعات | ضعیف (مدلهای سبز) |
متوسط (مدلهای آبی) |
خوب (مدلهای نارنجی) |
عالی (مدلهای قرمز) |
|---|---|---|---|---|
| CPU | Intel Core i3/i5/i7/i9 (7-14th) | Intel Core i7/i9 (10-14th) | Intel Core i9 (14th) Or Core Ultra 265k/285K | Core Ultra 265k/285K |
| RAM | 8-16GB DDR4 4000Mhz CL19 | 16-32GB DDR4/5 5200Mhz CL22 | 32-64GB DDR5 7000Mhz CL32 | 64-128GB DDR5 9000Mhz CL36 |
| VGA | Nvidia series 1-3 6GB-12GB (RTX1050Ti - RTX3090Ti) |
Nvidia series 3-4 8GB-16GB (RTX3060Ti - RTX4090Ti) |
Nvidia series 4-5 12GB-24GB (RTX4070Ti - RTX5070Ti) |
Nvidia series 5 24GB-48GB (RTX5080Ti - RTX5090Ti) |
| SSD | 128GB SATA 6.0 | 128GB SATA 6.0 or M.2 256GB Gen3 | M.2 500GB NVME Gen3-5 | M.2 NVME Gen5 |
| حجم پارامترها | 0.5b - 4b | 4b - 12b | 12b - 32b | 32b - 80b |
| زمان پاسخ به سوالات |
5 الی 90 ثانیه | 15 الی 120 ثانیه | 30 الی 360 ثانیه | 45 الی 600 ثانیه |
فایل OllamaSetup.exe را از جدول پایین دانلود و نصب کنید. پس از نصب، آیکون یک لاما کوچک در کنار ساعت ویندوز (Taskbar) ظاهر میشود.
دکمه Win + R را بزنید، تایپ کنید cmd و اینتر بزنید تا پنجره سیاه رنگ (Terminal) باز شود.
دستور زیر را در پنجره سیاه کپی و اینتر کنید:
ollama run gemma3:12b
پس از وارد کردن دستور، سیستم به صورت خودکار شروع به دانلود مدل gemma3:12b میکند (فقط بار اول). پس از اتمام دانلود، شما میتوانید مستقیماً در همان پنجره با هوش مصنوعی چت کنید.
💡 نکته: برای خروج از محیط چت، عبارت /bye را تایپ کنید.
| لینکهای دانلود نرمافزار (نسخه ویندوز) | |||
|---|---|---|---|
| نرمافزار Ollama |
📥 دانلود مستقیم از Soft98.ir 📥 دانلود مستقیم از P30downlod.ir 📥 دانلود مستقیم Ollama |
نرمافزار LM Studio |
📥 دانلود مستقیم از Soft98.ir 📥 دانلود مستقیم از Yasdl.ir 📥 دانلود از سایت رسمی |
| ویژگیهای Ollama با LM Studio | ||
|---|---|---|
| ویژگی | Ollama | LM Studio |
| هدف اصلی | اجرای سریع و راحت مدلها | تست، بررسی و کار تخصصی با مدل |
| رابط کاربری | ترمینال (CMD) / کدنویسی | گرافیکی (پنجره و دکمه) |
| مصرف منابع | بسیار کم و بهینه | کمی بیشتر (به دلیل رابط گرافیکی) |
| مناسب برای... | استفاده روزمره و توسعهدهندگان | محققان و کسانی که محیط گرافیکی میخواهند |
| نصب مدل | با یک دستور ساده (مثل کپسولهای بالا) | جستجو و دانلود دستی نسخهها |
| آپلود فایل | دارد | دارد |
| اجرای مدلهای سنگین | دارد | ندارد |
| اجرای پارامتر | قابلیت اجرا بالاتر از منابع سخت افزاری بدون محدودیت تا مدلهای 200b را میتوان اجرا نمود |
صرفاً متناسب با منابع سخت افزاری فقط میتوان مدلهای سازگار تا 80b را دانلود و اجرا نمود |
| سرعت پاسخ | سریع | آهسته |
| دانلود مدل | سریع | آهسته |
برای ورود به سایت اصلی Ollama و یا مشاهده هر یک از مدلهای هوش مصنوعی حتماً باید از برنامه های تحریمشکن یا فیلترشکن استفاده نمائید.
| نام مدل هوش مصنوعی | پشتیبانی از فارسی | نسخههای موجود (برای کپی دستور، روی هر کپسول کلیک کنید) | لینک منبع |
|---|---|---|---|
| Gemma 3 (پیشنهادی) |
بله | 1b = 0.9GB 4b = 3.3GB 12b = 8.1GB 27b = 17GB | صفحه مدل |
| DeepSeek R1 | بله | 1.5b = 1.1GB 7b = 4.7GB 8b = 4.9GB 14b = 9GB 32b = 20GB 70b = 43GB 671b = 404GB | صفحه مدل |
| ChatGPT OSS | بله | 20b = 14GB 120b = 65GB | صفحه مدل |
| Llama 3.1 | بله | 8b = 4.9GB 70b = 43GB 405b = 243GB | صفحه مدل |
| Phi-3 | بله | 3.8b = 2.2GB 14b = 7.9GB | صفحه مدل |
| Phi-4 | بله | 14b = 9.1GB | صفحه مدل |
| Mistral | بله | 7b = 5.6GB 12b = 7.1GB | صفحه مدل |
| Qwen 3 | بله | 0.6b = 0.5GB 1.7b = 1.4GB 4b = 2.5GB 8b = 5.2GB 14b = 9.3GB 30b = 19GB 32b = 20GB 235b = 142GB | صفحه مدل |
| Qwen 3 Coder (پیشنهادی) |
بله | 30b = 19GB 480b = 290GB | صفحه مدل |
| Qwen 3 Coder Next | بله | 79.7b = 52GB 79.7b = 85GB | صفحه مدل |
* توجه: برای دریافت مدلها پس از نصب Ollama، کافیست با باز کردن cmd بصورت Run as administrator دستور ollama run [model-name] را در ترمینال اجرا کنید یا از لینکهای فوق استفاده نمایید. مثلاً ollama run gemma3:12b
برای افرادی که قصد دارند همزمان با بازیهای گرافیکی بالا، برنامهنویسی، و اجرای مدلهای هوش مصنوعی بزرگ را در یک سیستم خانگی انجام دهند، ترکیبی از پردازندهی 20 هستهای Intel Core Ultra 7 265K، کارت گرافیک RTX 5070 12GB GDDR7، و حافظهی 64GB DDR5 6000MHz بهترین انتخاب است. این ترکیب نه تنها در حال حاضر توان بالایی در پردازش سنگین را داراست، بلکه با قابلیت گسترش حافظه و افزودن SSD Gen 5، میتواند برای چند سال آینده آماده باشد.
| بخش | جزئیات | توضیحات |
|---|---|---|
| مادربورد | ASUS TUF GAMING Z890‑PRO WIFI |
مجهز به هوش مصنوعی جهت مدیریت هماهنگی قطعات و افزایش کُلاک (16‑فاز CPU Power) - (1‑فاز iGPU) - (2‑فاز VCCSA) - (1‑فاز VNNAON) 4xDIMM DDR5 (پشتیبانی حافظه تا حداکثر 256GB) 1xM.2 PCIe Gen5 x4 | 3xM.2 PCIe Gen4 x4 | 4xSATA 6 Gb/s 1xIntel 2.5Gbps Ethernet | 1xWi‑Fi 7 |
| پردازنده | Intel Core Ultra 7 265K | دارای 20 هسته (8P + 12E) فرکانس پایه: 3.9GHz و فرکانس توسعه 5.5GHz boost 13TOPS AI NPU 31.1 ملیارد ترانزستور 3nm |
| کارت گرافیک | ASUS Dual GeForce RTX 5070 12GB GDDR7 | تعداد هسته 6144 و 5nm FinFET فرکانس پایه 2325MHz و فرکانس توسعه یافتته 2512MHz boost 1750MHz ساعت حافظه (28Gbps مؤثر) 12GB GDDR7 192bit با باندورِد 672GB/s TMU:192 | ROP:80 |
| حافظه رم | Corsair Vengeance RGB 64GB DDR5 6000MHz CL38 Dual | 64GB (2x32GB) 6000MT/s XMP III Dual‑channel 12GB/s باندورِد. |
| ذخیرهسازی | Samsung 970 EVO Plus 500GB (PCIe 3.0 x4) | 500GB SSD با سرعت 3500/3200MB/s |
| خنککننده | Hydrogon D120 ARGB | 6heat‑pipe | 2x120mm ARGB 56.23CFM | 1.98mm H₂O 1850RPM | 30.5dBA. |
| منبع | Green GP1000B‑GXD 1000W (ATX12V) | قدرت 1000W کاملاً ماژولار 83.3A 12V 22A 3.3V. |
جدول زیر اطلاعات مهمی از سیستم پیشنهاد شده خانگی برای کاربرانی که از هوش مصنوعی استفاده میخواهند نمایند را نمایش میدهد.
| ویژگی | مقدار |
|---|---|
| AI NPU (CPU) | 13TOPS (FP16) |
| GPU Tensor Cores | 192 (FP16 30.87 TFLOPS، FP32 31.24 TFLOPS) |
| حافظه GPU | 12GB GDDR7 (672GB/s) |
| کاربرد FP16 | 30.87TFLOPS |
| کاربرد FP32 | 31.24TFLOPS |
| کاربرد FP64 | 488GFLOPS |
| Cache L1 | 128KB |
| Cache L2 | 48MB(shared) |
| PCIe Bandwidth | 20lane Gen5 (640GB/s) |
| نسبه برق/عملکرد | 0.08W/TFLOPS |
| دقت FP16 نسبت به FP32 | 90%≈ |
| latency (1‑layer inference) | 1ms< |
در جدول زیر، توانایی اجرای مدلهای مختلف هوش مصنوعی بر اساس پارامتر مد بررسی شده است.
| مد (پارامتر) | قابل اجرا بر روی این سیستم؟ |
دلیل | پیشنهاد ارتقا (در صورت لزوم) |
|---|---|---|---|
| 1B | ✔️ | حافظه 12 GB کافی و پردازش کافی | هیچ چیز |
| 2B | ✔️ | حافظه کافی، CPU/AI NPU مناسب | هیچ چیز |
| 4B | ✔️ | حافظه کافی، کارایی بالا | هیچ چیز |
| 8B | ✔️ | حافظه کافی، CPU/AI NPU مناسب برای FP16 | هیچ چیز |
| 10B | ✔️ | حافظه 12 GB کافی، CPU/AI NPU مناسب برای FP16 | هیچ چیز |
| 12B | ✔️ | حافظه 12 GB، CPU/AI NPU 13 TOPS برای FP16/FP32 | هیچ چیز |
| 14B | ✔️ | حافظه کافی اما بار CPU/AI NPU نزدیک به حداکثر | افزایش حافظه گرافیک یا AI NPU 30 TOPS |
| 18B | ✔️ | حافظه گرافیک کافی، CPU/AI NPU محدود | خنککننده قویتر و افزایش AI NPU |
| 20B | ✔️ | حافظه گرافیک کافی، CPU/AI NPU کافی برای FP16 اما ممکن است دمای بالا باشد | ارتقا به GPU 16GB یا افزایش AI NPU |
| 30B | ✔️ | حافظه گرافیک 12 GB کافی نیست و آهسته اجرا میشود؛ نیاز به 16GB حافطه است | GPU 16GB (RTX 5070Ti) GPU 24GB (RTX 5080) |
| 32B | ✔️ | حافظه گرافیک 12 GB کافی نیست و آهسته اجرا میشود؛ نیاز به حداقل 16GB حافظه است | GPU 16GB (RTX 5070Ti) GPU 24GB (RTX 5080) |
| 48B | ✔️ | به درستی قابل اجرا نیست. حافظه گرافیک 12ۀB کافی نیست و آهسته اجرا میشود؛ نیاز به 24GB حافظه است | GPU 24GB (RTX 5080) |
| 50B | ❌ | به درستی قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 128GB است حافظه گرافیک 12GB کافی نیست و بسیار آهسته اجرا میشود؛ نیاز به 24GB حافظه است |
GPU 24GB (RTX 5080) |
| 70B | ❌ | اصلاً قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 128GB است حافظه گرافیک 12GB کافی نیست و به شدت آهسته اجرا میشود؛ نیاز به 48GB حافظه است |
GPU 2x24GB (RTX 5080Ti) |
| 80B | ❌ | اصلاً قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 128GB است حافظه گرافیک 12GB کافی نیست و به شدت آهسته اجرا میشود؛ نیاز به 64GB حافظه است |
GPU 2x32GB (RTX 5090Ti) |
| 100B | ❌ | اصلاً قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 256GB است مقدار 12GB حافظه گرافیک کافی نیست و حداقل 64GB حافظه نیاز دارد |
استفاده همزمان از چند گرافیک 4xRTX 5070Ti 16GB (64GB) 2xRTX 5080Ti 32GB (64GB) 2xRTX 5090Ti 32GB (64GB) |
| 120B | ❌ | اصلاً قابل اجرا نیست. مقدار حافظه 64GB کافی نیست و نیازمند 256GB است مقدار 12GB حافظه گرافیک کافی نیست و حداقل 64GB حافظه نیاز دارد |
استفاده همزمان از چند گرافیک 4xRTX 5070Ti 16GB (64GB) 2xRTX 5080Ti 32GB (64GB) 2xRTX 5090Ti 32GB (64GB) |
جدول زیر مدلهای مناسب و دستورات نصب در Ollama و My‑Studio را فهرست میکند.
| مدل | توضیحات | دستور نصب در Ollama | دستور نصب در My‑Studio |
|---|---|---|---|
| LLaMA‑3 70B | مدل 70B پارامتر، FP16 با 30 TFLOPS GPU مناسب. | ollama pull llama3:70b |
my-studio install llama3-70b |
| LLaMA‑3 8B | مدل 8B پارامتر، مناسب برای کاربردهای متوسط. | ollama pull llama3:8b |
my-studio install llama3-8b |
| Qwen‑2 72B | مدل 72B پارامتر، مناسب برای ترجمه و پردازش زبان طبیعی. | ollama pull qwen2:72b |
my-studio install qwen2-72b |
| Gemma‑2 2B | مدل 2B پارامتر، سبک، مصرف برق کم. | ollama pull gemma2:2b |
my-studio install gemma2-2b |
| Phi‑2 | مدل 2.7B پارامتر، مناسب برای کاربردهای کم مصرف. | ollama pull phi-2 |
my-studio install phi-2 |
| GPT‑4o‑Mini | مدل 2.7B پارامتر، قدرت بالا در متن و پرسش‑پاسخ. | ollama pull gpt-4o-mini |
my-studio install gpt-4o-mini |
| Mistral‑7B | مدل 7B پارامتر، سبک و سریع. | ollama pull mistral-7b |
my-studio install mistral-7b |
| StableLM‑Zephyr‑7B | مدل 7B پارامتر، مناسب برای توسعه و تحقیقات. | ollama pull stablelm-zephyr-7b |
my-studio install stablelm-zephyr-7b |
| LLaMA‑3.2 13B | مدل 13B پارامتر، مناسب برای مدلهای متوسط. | ollama pull llama3.2:13b |
my-studio install llama32-13b |