
ডিপসিক-ভি৩.২-এক্সপ্রেস মাত্র পৌছেছে একটি পরীক্ষামূলক পুনরাবৃত্তি হিসেবে যা স্কেলে এবং দীর্ঘ প্রেক্ষাপটে দক্ষতার উপর দৃষ্টি নিবদ্ধ করে, সম্প্রদায়ের প্রতি স্পষ্ট সমর্থন সহ: ওপেন সোর্স, প্রকাশিত কার্নেল এবং একটি সস্তা API।
গোলমালের বাইরেও, মূল কথা হল এই মডেলটি, V3.1-টার্মিনাসের উপর ভিত্তি করে, ডিপসিক স্পার্স অ্যাটেনশন (DSA) নামে একটি সূক্ষ্মভাবে তৈরি স্পার্স অ্যাটেনশন মেকানিজমের সূচনা করে যা গুণমান বজায় রেখে প্রশিক্ষণ এবং অনুমানকে ত্বরান্বিত করে। কোম্পানিটি ইতিমধ্যেই এটি চালু করেছে অ্যাপ, ওয়েব এবং এপিআই, এবং ব্যবহারের দাম কমিয়েছে ৮০%, একটি আক্রমণাত্মক পদক্ষেপ যা, সত্যি বলতে, প্রতিযোগিতাকে চাপা দেয়।
DeepSeek-V3.2-Exp এর নতুন প্রধান বৈশিষ্ট্যগুলি
তারকা উদ্ভাবন হল DSA, যা একটি নির্বাচনী মনোযোগ সম্পূর্ণ ক্রমটি সম্পূর্ণভাবে না দেখেই প্রসঙ্গের প্রাসঙ্গিক অংশগুলিতে। কোম্পানির নিজস্ব মতে, মানের উপর প্রভাব খুবই কম, যখন দক্ষতা বৃদ্ধি দীর্ঘ প্রেক্ষাপটে এটি স্পষ্ট।
প্রাপ্যতার ক্ষেত্রে, মডেলটি কার্যকরী অ্যাপ্লিকেশন, ওয়েব এবং API প্রথম দিন থেকেই, পরীক্ষা এবং গ্রহণের সুবিধার্থে উল্লেখযোগ্য মূল্য হ্রাস (৫০%+) সহ। যারা তুলনা করতে চান তাদের জন্য, ডিপসিক একটি অস্থায়ী শেষবিন্দু V3.1-টার্মিনাস থেকে ১৫ অক্টোবর, ২০২৫ তারিখের ১৫:৫৯ UTC পর্যন্ত।
DeepSeek-V3.2-Exp কর্মক্ষমতা এবং মানদণ্ড: V3.1-টার্মিনাসের সাথে সমতা
ডিপসিক অনুসন্ধান করেছে যে সমতা V3.1-টার্মিনাসের সাথে বিস্তৃত পরীক্ষায়, সঠিকভাবে বিক্ষিপ্ত মনোযোগ প্রবর্তনের প্রভাবকে আলাদা করার জন্য। বাস্তবে, এর ফলে যুক্তিতে তুলনামূলক মেট্রিক্স পাওয়া যায়, আইনসংগ্রহ এবং এজেন্ট-ধরণের সরঞ্জামের ব্যবহার।
বিভিন্ন উৎস এমন পরিসংখ্যান প্রদান করে যা প্রত্যাশা নির্ধারণে সাহায্য করে: V3.2-Exp কে একটি মডেল হিসেবে বর্ণনা করা হয়েছে যার 685 বিলিয়ন প্যারামিটার এবং অনুরূপ কর্মক্ষমতা অথবা ডোমেনের উপর নির্ভর করে সামান্য তারতম্য সহ। সরঞ্জাম ছাড়া যুক্তিতে, 85.0 এর মতো সংখ্যা উল্লেখ করা হয় MMLU-Pro এবং 89.3 মধ্যে এআইএম 2025; এজেন্ট পরিস্থিতিতে, 40.1 প্রদর্শিত হয় ব্রাউজকম্প এবং 67.8 মধ্যে SWE যাচাইকৃতএই ফলাফলগুলি সরকারী বর্ণনার সাথে খাপ খায় দক্ষতা যাচাই করা নির্ভুলতার ক্ষেত্রে এক বিরাট লাফ দেওয়ার চেয়ে।
এমনকি সূক্ষ্ম তুলনাও রয়েছে: কোডিং কাজে, বৃদ্ধি 2121 ২০৪৬ সালের তুলনায় কোডফোর্সেসে, যেখানে আরও মানবিক পরীক্ষায় সামান্য হ্রাস পরিলক্ষিত হয় (যেমন, 19.8 হিউম্যানিটি'স লাস্ট এক্সামে ২১.৭ এর তুলনায়)। সামগ্রিকভাবে, টেবিলটি পরামর্শ দেয় ভারসাম্য: গতিকে প্রধান লক্ষ্য রেখে নির্দিষ্ট উন্নতি এবং ছোট ছোট ছাড়।
ডিএসএ: সূক্ষ্মভাবে ছড়িয়ে ছিটিয়ে থাকা মনোযোগ, স্পষ্টভাবে বলা হয়েছে
বিস্তৃত প্রেক্ষাপটের সাথে সাথে ধ্রুপদী যত্ন ব্যয়বহুল হয়ে ওঠে; জেলাকে যেখানে কাজ কম অবদান রাখে সেখানে কাজ কমিয়ে দেয়। সূক্ষ্ম নিয়ন্ত্রণের সাথে স্পারসিটি প্রয়োগ করে, মডেলটি গণনাকে কেন্দ্রীভূত করে যেখানে এটি আসলে সংকেত খুঁজে পায়, উন্নত করে অদৃশ্যতা এবং উৎপাদন বিকৃত না করে খরচ কমানো।
বাস্তব অভিজ্ঞতার স্তরে, এটি এমন কাজের ক্ষেত্রে লক্ষণীয় যেগুলির জন্য প্রয়োজন অনেক প্রসঙ্গ: দীর্ঘ নথির সারাংশ, লগ বিশ্লেষণ, দীর্ঘ সংলাপ ধারণকারী এজেন্ট, অথবা পাইপলাইন যা পুনরুদ্ধার এবং প্রজন্মকে মিশ্রিত করে। ঠিক সেখানেই, দক্ষতা এটি কোনও বিলাসিতা নয়: এটি কোনও কিছুর স্কেলে ব্যবহারযোগ্য হওয়া বা না হওয়ার মধ্যে পার্থক্য।
DeepSeek-V3.2-Exp এর প্রাপ্যতা, মূল্য এবং তুলনা
ডিপসিক ঘোষণা করেছে যে V3.2-Exp এখন উপলব্ধ অ্যাপ, ওয়েব এবং এপিআই। এছাড়াও, এটি API-এর দাম 100% এরও বেশি কমিয়েছে ৮০% তাৎক্ষণিকভাবে কার্যকর, একটি সিদ্ধান্ত যার লক্ষ্য গ্রহণ সম্প্রসারণ এবং উৎসাহিত করা তুলনামূলক পরীক্ষা.
যারা পূর্ববর্তী মডেলের সাথে তুলনা করতে চান তাদের জন্য, V3.1-টার্মিনাস একটি রক্ষণাবেক্ষণ করা হয়েছে শেষপ্রান্ত ১০/১৫/২০২৫ ১৫:৫৯ (UTC) পর্যন্ত অস্থায়ী। কোম্পানিটি জমা দেওয়ার জন্যও আমন্ত্রণ জানিয়েছে। প্রতিক্রিয়া একটি জনসাধারণের মাধ্যমে, সম্প্রদায়ের সাথে ক্রমাগত উন্নতির গতিশীলতাকে শক্তিশালী করে।
ওপেন সোর্স স্ট্যাটাস: ওজন, প্রযুক্তিগত প্রতিবেদন এবং কার্নেল
ডিপসিক মডেলটিকে হাগিং ফেস-এ প্রকাশ করে, সাথে একটি প্রযুক্তিগত প্রতিবেদন যা পরিবর্তন এবং ফলাফলের নথিভুক্ত করে। স্বচ্ছতার প্রতি এবং দীর্ঘমেয়াদী ফলিত গবেষণার প্রচারের প্রতি স্পষ্ট প্রতিশ্রুতি রয়েছে কম খরচ.
কার্নেল স্তরে, দুটি উপায় আছে: TileLang এর জন্য পড়া এবং প্রোটোটাইপিং আরও অ্যাক্সেসযোগ্য, এবং সর্বাধিক কর্মক্ষমতার জন্য CUDA। লজিট ইনডেক্স কার্নেল (পৃষ্ঠাযুক্ত ভেরিয়েন্ট সহ) রয়েছে DeepGEMM সম্পর্কে, যেখানে বিক্ষিপ্ত মনোযোগের অধিকারী ব্যক্তিরা প্রকাশিত হয় FlashMLA সম্পর্কেএই বিচ্ছেদ গবেষণা এবং উৎপাদনমুখী সম্প্রদায়ের জন্য তাদের উপযুক্ত স্থান খুঁজে পাওয়া সহজ করে তোলে।
DeepSeek-V3.2-Exp এবং ইনফারেন্স ডেমোর স্থানীয় সম্পাদন
ডিপসিক একটি সংগ্রহস্থল অফার করে অনুমান দ্রুত শুরু করতে এবং স্থাপত্য পরিদর্শন করার জন্য একটি আপডেটেড ডেমো সহ। প্রথম ধাপ হল হাগিং ফেস ওয়েটগুলিকে ডেমো দ্বারা প্রত্যাশিত ফর্ম্যাটে রূপান্তর করা, বিশেষজ্ঞের সংখ্যা এবং মডেল সমান্তরালতা নির্ধারণ করা।
ইন্টারেক্টিভ রূপান্তর এবং জেনারেশনের জন্য উদাহরণ কমান্ড (GPU সংখ্যায় EXPERTS=256 এবং MP সেট করুন): যেমন আছে তেমন ব্যবহার করা যেতে পারে প্রস্তুত পরিবেশে।
সিডি ইনফারেন্স এক্সপোর্ট এক্সপের্টস=২৫৬ পাইথন কনভার্ট.পি --এইচএফ-সিকেপিটি-পাথ ${এইচএফ_সিকেপিটি_পাথ} --সেভ-পাথ ${সেভ_পাথ} --এন-এক্সপের্টস ${এক্সপের্টস} --মডেল-প্যারালাল ${এমপি} এক্সপোর্ট কনফিগ=কনফিগ_৬৭১বি_ভি৩.২.জেসন টর্চরান --এনপ্রোক-পার-নোড ${এমপি} জেনারেট.পি --সিকেপিটি-পাথ ${সেভ_পাথ} --কনফিগ ${কনফিগ} --ইন্টারেক্টিভ
যারা পছন্দ করেন তাদের জন্য এসজিল্যাং, প্রস্তুত ছবি এবং একটি বুট কমান্ড রয়েছে। সাপোর্টটি NVIDIA (H200), AMD (MI350) GPU এবং নির্দিষ্ট ট্যাগ সহ কিছু NPU গুলিকে কভার করে।
# H200 ডকার পুল lmsysorg/sglang:dsv32 # MI350 ডকার পুল lmsysorg/sglang:dsv32-rocm # NPUs ডকার পুল lmsysorg/sglang:dsv32-a2 ডকার পুল lmsysorg/sglang:dsv32-a3 পাইথন -m sglang.launch_server --model deepseek-ai/DeepSeek-V3.2-Exp --tp 8 --dp 8 --page-size 64
আপনি যদি পছন্দ করেন ভিএলএলএম, প্রথম দিন থেকেই সমর্থন রয়েছে। হালনাগাদ পরামিতিগুলির জন্য অফিসিয়াল রেসিপিগুলি পর্যালোচনা করা বাঞ্ছনীয় এবং অপ্টিমাইজেশন হার্ডওয়্যার দ্বারা।
API: শেষবিন্দু, সামঞ্জস্যতা এবং মেয়াদোত্তীর্ণতা
এর এপিআই ডিপসিক স্ট্যান্ডার্ড কনভেনশন অনুসরণ করে এবং জনপ্রিয় SDK-এর সাথে সামঞ্জস্যপূর্ণ। ডিফল্টরূপে, বেস URL ব্যবহার করে https://api.deepseek.com আপনি V3.2-Exp লক্ষ্য করছেন, যা প্রাথমিক ইন্টিগ্রেশন এবং অ্যাক্সেসকে সহজ করে তোলে হ্রাসকৃত মূল্য.
বেঞ্চমার্কিংয়ের জন্য, V3.1-টার্মিনাসের জন্য একটি অস্থায়ী শেষ বিন্দু রয়েছে: https://api.deepseek.com/v3.1_terminus_expires_on_20251015. পরিকল্পনা করার জন্য মেয়াদ শেষ হওয়ার তারিখ এবং সময় (১৫ অক্টোবর, ২০২৫, ১৫:৫৯ ইউটিসি) মনে রাখবেন benchmarks.
এছাড়াও, এর বাস্তুতন্ত্রের সাথে সামঞ্জস্য রয়েছে নৃতাত্ত্বিক. তুমি বেস ব্যবহার করতে পারো https://api.deepseek.com/anthropic ক্লড-স্টাইলের ইন্টারঅ্যাকশনের জন্য, অথবা পূর্ববর্তী মডেলের সাথে তুলনা করার প্রয়োজন হলে অস্থায়ী শেষ বিন্দুর সাথে সম্পর্কিত বৈকল্পিকের জন্য।
প্রমাণীকরণ এবং কী ব্যবস্থাপনা
অনুরোধগুলি দ্বারা প্রমাণিত হয় বাহক অনুমোদন শিরোনামে। ডিপসিক ড্যাশবোর্ড থেকে আপনার কী তৈরি করুন এবং এটি নিরাপদে সংরক্ষণ করুন, উদাহরণস্বরূপ, পরিবেশ ভেরিয়েবল বা ফাইল ম্যানেজারে। অন্ধিসন্ধি AWS সিক্রেটস ম্যানেজার হিসেবে।
প্যানেলটি ব্যবহার নিয়ন্ত্রণের জন্য ব্যবহার এবং বিলিং দেখায় টোকেন। যদিও দাম কমে গেছে, কম্পিউটারে রেট লিমিটিং এবং পর্যায়ক্রমিক কী ঘূর্ণন প্রয়োগ করা বাঞ্ছনীয়, এর পাশাপাশি যেকোনো ক্ষতিগ্রস্থ চাবি অবিলম্বে.
চ্যাট সম্পূর্ণকরণ, টেমপ্লেট এবং মৌলিক অনুরোধ
কেন্দ্রীয় শেষবিন্দু হল /চ্যাট/সম্পূর্ণতা, যা বহু-পালা সংলাপ প্রক্রিয়া করে এবং কলগুলির মধ্যে প্রসঙ্গ বজায় রাখে, V3.2-Exp এর দীর্ঘ-প্রসঙ্গ শক্তির জন্য একটি আদর্শ দৃশ্যকল্প। দুটি সাধারণ মডেল মোড রয়েছে: ডিপসিক-চ্যাট y ডিপসিক-রিজনার.
একটি সাধারণ অনুরোধের বডি দেখতে এরকম হতে পারে, যেখানে escaped JSON ব্যবহার করা হয় (স্পষ্টতার জন্য এখানে " হিসাবে উপস্থাপন করা হয়েছে): একটি সিস্টেম প্রম্পট এবং একটি ব্যবহারকারী প্রম্পট অন্তর্ভুক্ত করে.
{ "মডেল": "ডিপসিক-চ্যাট", "মেসেজ": [ { "ভূমিকা": "সিস্টেম", "বিষয়বস্তু": "আপনি একজন প্রযুক্তিগত বিশেষজ্ঞ।" }, { "ভূমিকা": "ব্যবহারকারী", "বিষয়বস্তু": "বিচ্ছিন্ন মনোযোগ ব্যাখ্যা করুন।" } ], "স্ট্রিম": মিথ্যা }
যখন আপনি রিয়েল-টাইম উত্তর চান, তখন সক্রিয় করুন স্ট্রিম = সত্য। হেডারগুলিতে অবশ্যই Content-Type: application/json এবং Authorization টোকেন: Bearer ${DEEPSEEK_API_KEY} অন্তর্ভুক্ত থাকতে হবে। যদি আপনি স্পষ্ট যুক্তি দিয়ে কাজ করেন, তাহলে আপনি পতাকা ব্যবহার করে আচরণ নিয়ন্ত্রণ করতে পারেন। যুক্তি.সক্ষম.
প্রতিক্রিয়া কাঠামো এবং SSE স্ট্রিমিং
নন-স্ট্রিমিং প্রতিক্রিয়াগুলির মধ্যে রয়েছে যেমন ক্ষেত্রগুলি id, বস্তু, তৈরি, মডেল, পছন্দ এবং ব্যবহার। পছন্দগুলিতে, আপনি তৈরি করা সামগ্রী (ভূমিকা: "সহকারী") এবং ব্যবহারে, এর বিবরণ পাবেন প্রম্পট_টোকেন, সমাপ্তি_টোকেন এবং মোট_টোকেন।
স্ট্রিমিং মোডে, API পাঠায় সার্ভার-প্রেরিত ইভেন্ট। প্রতিটি টুকরো একটি ডেটা ইভেন্ট হিসেবে আসে যার সাথে একটি ডেল্টা থাকে যা আপনাকে সংগ্রহ করতে হবে। এটি এর জন্য আদর্শ বিকল্প ইন্টারফেসগুলি ইন্টারেক্টিভ বা ক্রমবর্ধমান আউটপুট সহ টার্মিনাল।
কঠোর JSON-এ ফাংশন কলিং এবং আউটপুট
আপনি সংজ্ঞায়িত করতে পারেন সরঞ্জাম তাই মডেলটি সিদ্ধান্ত নেয় কখন একটি ফাংশন কল করতে হবে, উদাহরণস্বরূপ, ডেটা পুনরুদ্ধার করতে বা ক্রিয়া সম্পাদন করতে। এটি এজেন্ট প্রবাহ এবং ইন্টিগ্রেশনের সাথে ভালভাবে খাপ খায়। ব্যাক.
যদি আপনার স্ট্রাকচার্ড আউটপুট প্রয়োজন হয়, তাহলে response_format ব্যবহার করে JSON মোড জোর করুন। এটি ডেটা এক্সট্রাকশনের জন্য দরকারী অথবা বৈধতা পাইপলাইনে স্বয়ংক্রিয়।
OpenAI-স্টাইল SDK সহ পাইথনের উদাহরণ
পাইথনের সাথে, ইনপুট কার্ভটি খুব মসৃণ। সেট করুন এপিআই_বেস ডিপসিকের মতো, কী এবং লঞ্চ অনুরোধগুলি সংজ্ঞায়িত করুন; আপনি আপনার ব্যবহারের ক্ষেত্রের উপর নির্ভর করে স্ট্যান্ডার্ড এবং স্ট্রিমিং মোডের মধ্যে স্যুইচ করতে পারেন।
import openai openai.api_base = "https://api.deepseek.com" openai.api_key = "your_api_key_here" response = openai.ChatCompletion.create( model="deepseek-chat", messages=[ {"role": "system", "content": "You are a coding assistant."}, {"role": "user", "content": "Fibonacci সংখ্যা গণনা করার জন্য একটি Python ফাংশন লিখুন।"} ], stream=False ) print(response.choices[0].message.content) # Streaming stream = openai.ChatCompletion.create(model="deepseek-chat", messages=[...], stream=True) for chunk in stream: if chunk.choices[0].delta.content is not None: print(chunk.choices[0].delta.content, end="") # Function calling (tool definition) tools = [ { "type": "function", "function": { "নাম": "আবহাওয়া পান", "বর্ণনা": "বর্তমান আবহাওয়া পান", "পরামিতি": { "প্রকার": "বস্তু", "বৈশিষ্ট্য": { "অবজেক্ট": {"প্রকার": "স্ট্রিং"} }, "প্রয়োজনীয়": [ "অবস্থান" ] } } ]
কঠোর JSON আউটপুটের জন্য, সেট করুন প্রতিক্রিয়া_বিন্যাস a {"type": "json_object"}। আর যদি তোমার দীর্ঘ সংলাপ করতে হয়, তাহলে যেতে ভুলো না প্রেক্ষাপট সংকুচিত করা আপনাকে সীমার মধ্যে রাখতে এবং দক্ষতা সর্বাধিক করতে।
অ্যাপিডগের সাথে ইন্টিগ্রেশন
এপিডগ ত্বরান্বিত করে প্রোটোটাইপিং কলব্যাক: স্পেসিফিকেশন আমদানি করুন, পরিবেশগত ভেরিয়েবল (যেমন কী) সংরক্ষণ করুন, পোস্ট তৈরি করুন এবং তাৎক্ষণিকভাবে পরীক্ষা করুন। এর রেসপন্স সিমুলেটর কোনও অতিরিক্ত খরচ ছাড়াই চরম কেস পরীক্ষা করা সহজ করে তোলে। টোকেন.
এটি বিভিন্ন ক্ষেত্রে কোড স্নিপেট তৈরি করে মূর্খতা এবং প্রমাণীকরণ বা প্যারামিটার ডিবাগ করার জন্য একটি টাইমলাইন ভিউ অফার করে। যেহেতু V3.2-Exp বিস্তৃত প্রসঙ্গ পরিচালনা করে, তাই Apidog পরীক্ষা-নিরীক্ষার একটি দুর্দান্ত উপায় দীর্ঘ প্রম্পট এবং কর্মক্ষমতা দেখুন।
এর থেকে সর্বাধিক সুবিধা পাওয়ার জন্য ভালো অভ্যাস
সিস্টেম প্রম্পট সংজ্ঞায়িত করুন স্পষ্ট এবং সংক্ষিপ্ত জটিল সমস্যার ক্ষেত্রে, যুক্তি পদ্ধতি সাহায্য করতে পারে, এটি আপনার ক্ষেত্রে উপযুক্ত চিন্তা-গঠন কৌশলগুলির সাথে একত্রিত করে।
পরিচালনা করুন প্রসঙ্গ মাথা সহ: যদিও V3.2-Exp দীর্ঘ-প্রসঙ্গ সহ্য করে (128K পর্যন্ত ক্ষেত্রে উল্লেখ করা হয়), অতিরিক্ত ইতিহাস দক্ষতার উপর প্রভাব ফেলতে পারে। এটি স্মার্ট ট্রাঙ্কেশন প্রয়োগ করে, গোপন ঘন ঘন এবং ব্যাচ প্রশ্নের জন্য যেখানে এটি যুক্তিসঙ্গত।
নিরাপত্তার ক্ষেত্রে, এটি তাৎক্ষণিক ইনজেকশন প্রতিরোধ করার জন্য ইনপুট স্যানিটাইজ করে এবং মিথস্ক্রিয়া লগ করে নিরীক্ষা. আপনার লক্ষ্য অনুসারে তাপমাত্রা এবং top_p সামঞ্জস্য করুন: নির্ধারণবাদের জন্য কম মান, সৃজনশীলতার জন্য উচ্চ মান।
এর মধ্যে A/B পরীক্ষা করুন ডিপসিক-চ্যাট y ডিপসিক-রিজনার সর্বোত্তম মোড বেছে নিতে। এবং চমক এড়াতে হারের সীমা মনে রাখবেন বিলিং.
V3.1-টার্মিনাসের সাথে তুলনা
ডিএসএ প্রবর্তনের ফলে উন্নতি ঘটে অদৃশ্যতা যা, কিছু পরিস্থিতিতে, সামগ্রিক মানের সমতাকে ক্ষুন্ন না করেই 3x গতিতে পৌঁছায়। এটি সম্পর্কের উপর দৃষ্টি নিবদ্ধ করা একটি বিবর্তন শক্তি/দক্ষতা নির্ভুলতা রেকর্ডের চেয়ে বেশি।
কোডিংয়ের ক্ষেত্রে সামান্য বৃদ্ধি এবং মানবিক শাখায় সামান্য হ্রাস একটি মডেলের সূক্ষ্ম-সুরকরণকে প্রতিফলিত করে, যা নকশা অনুসারে, পরীক্ষামূলকV3.1 টেম্পোরাল এন্ডপয়েন্ট দীর্ঘমেয়াদে DSA লাভের সরাসরি তুলনা করার অনুমতি দেয়।
উন্নত স্থানীয় স্থাপনা
গোপনীয়তা-সংবেদনশীল বা অফলাইন স্থাপনার জন্য, ডাউনলোড করুন পেসো Hugging Face থেকে এবং অফিসিয়াল কনভার্সন স্ক্রিপ্ট ব্যবহার করাই হল সঠিক উপায়। বিশেষজ্ঞের সংখ্যা নির্ধারণ করুন (যেমন, ২৫৬) এবং আপনার প্রয়োজন অনুযায়ী মডেলের সমান্তরালতা সামঞ্জস্য করুন। জিপিইউ.
ইনফারেন্স ডেমো ইন্টারেক্টিভ মোডে এবং কার্নেলগুলিতে পরীক্ষার অনুমতি দেয় টাইল্যাং অথবা CUDA আপনাকে অগ্রাধিকার অনুসারে কর্মক্ষমতা কমাতে সাহায্য করবে: প্রোটোটাইপিংয়ের গতি অথবা সর্বোচ্চ থ্রুপুট উৎপাদন.
কার্নেল খুলুন এবং কর্মক্ষমতা
টাইলল্যাং অগ্রাধিকার দেয় স্পষ্টতা এবং গবেষণার জন্য ডিজাইন, যাতে আপনি দ্রুত নতুন ধারণাগুলি পুনরাবৃত্তি করতে পারেন। আপনি যদি যত্নের ধরণগুলি অন্বেষণ করেন তবে এটি নিখুঁত। বিক্ষিপ্ত অথবা মেমরি অপ্টিমাইজেশন।
প্রতি মিলিসেকেন্ডে চাপ দেওয়ার জন্য, CUDA কার্নেলগুলি কার্যকর হয়: লগিট সূচকগুলি (পৃষ্ঠাযুক্ত সংস্করণ সহ) ভিতরে রয়েছে DeepGEMM সম্পর্কে, যখন বিক্ষিপ্ত মনোযোগের অধিকারী ব্যক্তিরা বাস করে FlashMLA সম্পর্কেএই বিভাজন প্রতিটি দলকে বেছে নিতে দেয় গাদা কাজ পুনরায় না করেই সর্বোত্তম।
DeepSeek-V3.2-Exp লাইসেন্স, অ্যাপয়েন্টমেন্ট এবং যোগাযোগ
সংগ্রহস্থল এবং পেসো মডেলটি এমআইটি লাইসেন্সের অধীনে প্রকাশিত। এটি বাণিজ্যিক ব্যবহারের দরজা খুলে দেয়, গ্রহণকে উৎসাহিত করে এবং নবপ্রবর্তিত বস্তু বাস্তুতন্ত্রের মধ্যে
চাকরিতে V3.2-Exp উল্লেখ করার জন্য, DeepSeek একটি প্রদান করে অ্যাপয়েন্টমেন্ট এন্ট্রি @misc টাইপের যার শিরোনাম "DeepSeek-V3.2-Exp: Boosting Long-Context Efficiency with DeepSeek Sparse Attention" এবং লেখকত্ব "DeepSeek-AI" (বছর ২০২৫)। প্রশ্ন বা ঘটনার জন্য, যোগাযোগের ইমেল ঠিকানা হল service@deepseek.com.
DeepSeek-V3.2-Exp সম্পর্কে অফিসিয়াল রিসোর্স এবং দরকারী লিঙ্ক
যদি আপনি মডেলটি ডাউনলোড করতে চান, তাহলে আপনার কাছে এটি আছে আলিঙ্গন মুখশ্বেতপত্রটি GitHub-এ রয়েছে, বাস্তবায়নের বিবরণ সহ এবং মূল্যায়ন.
V3.2-Exp এবং V3.1-Terminus এর মধ্যে তুলনামূলক পরীক্ষার জন্য, দেখুন অফিসিয়াল গাইড। এবং যদি আপনি পরামর্শ পাঠাতে চান, তাহলে আপনার একটি চ্যানেল আছে প্রতিক্রিয়া https://feedback.deepseek.com/dsa-এ সর্বজনীন।
V3.2-Exp এর মাধ্যমে, DeepSeek একটি সহজ ধারণাকে অগ্রাধিকার দেয়: গুণমান ত্যাগ না করে দক্ষতাDSA এমন মডেলগুলির জন্য পথ প্রশস্ত করে যা যুক্তিসঙ্গত খরচে বিশাল প্রেক্ষাপট সমর্থন করে, সুবিন্যস্ত API এই ক্ষমতাগুলিকে আরও বেশি টিমের কাছে নিয়ে আসে এবং স্ট্যাকের উন্মুক্ততা (ওজন, কার্নেল এবং ডকুমেন্টেশন) সম্প্রদায়ের জন্য ঘর্ষণ ছাড়াই বাস্তব পণ্যগুলি গবেষণা, তুলনা এবং তৈরি করা সহজ করে তোলে।