
একটা সময় ছিল যখন ডিপসিক দেখিয়েছিল যে কম খরচে অনেক কিছু করা যায়। এখন আবার ফিরে এসেছে DeepSeek-V3.1 এবং একটি স্পষ্ট সংকেত: মডেলটি এর সাথে সূক্ষ্মভাবে সুরক্ষিত করা হয়েছে চাইনিজ চিপের পরবর্তী ব্যাচ। এটি বাজারের তাৎক্ষণিক উল্টোপাল্টা ইঙ্গিত দেয় না, তবে এটি এমন একটি দিক নির্দেশ করে যা কিছু লোককে অস্বস্তিকর করে তুলতে পারে। এনভিডিয়া এবং এই খাতের অন্যান্য অভিনেতারা।
কোম্পানি একটি চালু করেছে হাইব্রিড অনুমান দুটি রুট সহ: মনে (গভীর যুক্তি) এবং চিন্তাহীন (দ্রুত প্রতিক্রিয়া), যা তাদের ওয়েবসাইট এবং অ্যাপ থেকে টগল করা যেতে পারে। তাদের বার্তা অনুসারে, সংস্করণটি মনে আগেরটির তুলনায় সময় উন্নত করে, যা দেখায় যে কেবল ওজনই পরিবর্তিত হয়নি, বরং এক্সিকিউশন মোড যেগুলো ইতিমধ্যেই পরিষেবায় আছে।
একটি একক স্থাপত্যের জন্য দুটি অনুমান পথ
ডিপসিক-ভি৩.১ প্রস্তাবটি একটি পদ্ধতিকে একীভূত করে দ্বিমুখী রুট সর্বশেষ প্রজন্মের মডেলগুলিতে যা পরীক্ষা করা হচ্ছে তার কথা মনে করিয়ে দেয়: একটি মোডের মধ্যে স্যুইচ করা গভীর চিন্তা আরও জটিল কাজের জন্য, এবং তাৎক্ষণিক প্রতিক্রিয়ার জন্য আরও চটপটে। ইন্টারফেসে এখন প্রয়োজন অনুসারে আচরণ পরিবর্তন করার জন্য একটি "গভীর চিন্তাভাবনা" বোতাম অন্তর্ভুক্ত রয়েছে।
এই স্যুইচিং আপনাকে প্রতিটি প্রশ্নের সাথে খরচ এবং বিলম্বিতা মানিয়ে নিতে দেয়, যুক্তির গুণমান এবং গতির মধ্যে একটি ব্যবহারিক ভারসাম্য। ব্যবহারকারীর জন্য, এটি দীর্ঘ কথোপকথন এবং আরও দক্ষ ব্যবস্থাপনায় অনুবাদ করে ভিন্নধর্মী কাজ একই প্রবাহে।
UE8M0 FP8 দেশীয় চিপগুলির উপর ভিত্তি করে
ডিপসিক তাদের অফিসিয়াল উইচ্যাট চ্যানেলে পোস্ট করা একটি মন্তব্যে বলেছে: "UE8M0 FP8 সম্পর্কে এটি পরবর্তী প্রজন্মের দেশীয় চিপসের জন্য"। পাঠটি স্পষ্ট: V8 দ্বারা গৃহীত FP3.1 ডেটা ফর্ম্যাট হল স্থানীয় বাস্তুতন্ত্রের সাথে খাপ খাইয়ে নেওয়া। এর হাগিং ফেস ডেটাশিটে এটি নির্দেশিত হয়েছে যে মডেলটিকে ব্যবহার করে প্রশিক্ষণ দেওয়া হয়েছে UE8M0 FP8 স্কেল ফর্ম্যাট, এটি একটি লক্ষণ যে নির্ভুলতা কেবল ওজন প্যাকিংয়ের বিষয় নয়, বরং প্রশিক্ষণ এবং বাস্তবায়ন নকশার অংশ।
FP8, 8 বিটে কাজ করে, FP16/BF16 এর তুলনায় আকার অর্ধেক করে এবং, যখন স্থানীয়ভাবে সমর্থিত হয়, তখন প্রতি চক্রে উচ্চতর কর্মক্ষমতা এবং কম মেমোরি খরচ সক্ষম করে। সবকিছুই চীনা বাজারে পৌঁছানো চিপগুলির উপর নির্ভর করে। স্থানীয়ভাবে সুবিধা গ্রহণ করুন যদি সেই সারিবদ্ধতা বজায় থাকে, তাহলে চীনে কৃত্রিম বুদ্ধিমত্তাকে কে ক্ষমতা দেয় সে সম্পর্কে কথোপকথনের কিছু অংশ এটি বদলে দিতে পারে।

DeepSeek-V3.1 কর্মক্ষমতা, প্রসঙ্গ এবং উপলব্ধতা
ডিপসিক উল্লেখ করেছে যে আরও বিস্তৃত প্রসঙ্গ উইন্ডো যা, ভাগ করা তথ্য অনুসারে, ১২৮,০০০ টোকেন পর্যন্ত পৌঁছায়, দীর্ঘ নথি এবং বহু-পালা কথোপকথনের জন্য ডিজাইন করা হয়েছে। মডেলটি একটি API এর মাধ্যমে উপলব্ধ, এবং কোম্পানিটি Hugging Face-এ প্রযুক্তিগত সংস্থান বজায় রাখে, যেখানে UE8M0 FP8 এর ব্যবহারের বিস্তারিত বিবরণ রয়েছে।
MathArena (ETH Zürich-এর সাথে সংযুক্ত প্ল্যাটফর্ম) এর মতো বাহ্যিক মূল্যায়নে, V3.1-এ এর থিঙ্ক মোড শীর্ষ মডেলগুলির মধ্যে উপস্থিত হয়সঙ্গে GPT-5 সাম্প্রতিকতম র্যাঙ্কিংয়ে শীর্ষে। স্ন্যাপশটের বাইরেও, গুরুত্বপূর্ণ বিষয় হলো এই আপডেটটি মডেলটিকে প্রতিযোগিতামূলক সিঁড়ির শীর্ষে স্থান দিয়েছে এবং পুনরাবৃত্তিমূলক উন্নতির ক্ষমতাও রাখে।
তৃতীয় পক্ষের পরীক্ষাগুলি কোডিং এবং লজিক কাজের জন্য ইতিবাচক পরিসংখ্যানের রিপোর্ট করে, যদিও উচ্চ-মানের প্রতিদ্বন্দ্বীদের বিরুদ্ধে সঠিক র্যাঙ্কিং মডেল অনুসারে পরিবর্তিত হয়। উচ্চতার চিহ্নএকই সাথে, কোম্পানিটি গতি এবং যুক্তিকে স্থাপত্য এবং অনুমান মোডের সাথে একত্রিত করার উপর তার মনোযোগ বজায় রাখে।
প্রতিযোগিতামূলক উত্তেজনা এবং রপ্তানি নিয়ন্ত্রণ
V3.1 পদক্ষেপটি একটি নাজুক প্রেক্ষাপটে এসেছে: মার্কিন যুক্তরাষ্ট্র বজায় রেখেছে রপ্তানি নিয়ন্ত্রণ চীনে উন্নত চিপস, এবং স্থানীয় বাজার তার নিজস্ব বিকল্পগুলির প্রতি তার প্রতিশ্রুতি ত্বরান্বিত করছে। NVIDIA-এর জন্য, যা তার সর্বশেষ আর্থিক বছরের হিসাব অনুসারে প্রায় চীনের আয়ের ১৩%, FP8 সমর্থন সহ দেশীয় সমাধানগুলিতে সম্ভাব্য রূপান্তর সময়ের সাথে সাথে চাহিদা হ্রাস করতে পারে।
চিপের অবস্থা H20 চীনে, পারমিট, নিয়ন্ত্রক চাপ এবং ত্রাণ পরিকল্পনার মধ্যে পরিস্থিতি ওঠানামা করেছে। এই পরিস্থিতিতে, চীনা ডেভেলপারদের এই নিয়ন্ত্রক উইন্ডোগুলির উপর কম নির্ভর করার সুযোগ করে দেয় এমন যেকোনো উপায়ই ক্রমশ জনপ্রিয় হয়ে উঠছে। কৌশলগত মানতাই স্থানীয় সেমিকন্ডাক্টরগুলিতে "পরবর্তী কী" এর জন্য ডিজাইন করা একটি FP8-এর প্রতি আগ্রহ তৈরি হয়েছে।
আমাদেরও পা মাটিতে রাখতে হবে: ফাইন্যান্সিয়াল টাইমসের মতে, ডিপসিক খুঁজে পেয়েছে প্রযুক্তিগত অসুবিধা যখন আপনার R2 মডেলকে প্রশিক্ষণ দেওয়ার চেষ্টা করবেন হুয়াওয়ে আসেন এবং প্রশিক্ষণের জন্য NVIDIA GPU-তে ফিরে যেতে হয়েছিল, অনুমান চাইনিজ হার্ডওয়্যার যেখানে কার্যকর। সবচেয়ে বুদ্ধিমান পঠন হল V3.1 কে একটি হিসাবে বিবেচনা করা পুনরাবৃত্তি সেই দিকে, কোনও চূড়ান্ত লাফ নয়।
DeepSeek-V3.1 মূল্য নির্ধারণ এবং রোডম্যাপ
ডিপসিক অগ্রগতি যে থেকে সেপ্টেম্বর 6 সমন্বয় করবে আপনার API ফি, যে চ্যানেলটি মডেলটিকে তৃতীয় পক্ষের পণ্যগুলিতে একীভূত করার অনুমতি দেয়। কোনও বিস্তারিত তথ্য প্রকাশ করা হয়নি, তবে বার্তাটি একটি কৌশলের সাথে খাপ খায় ধারণক্ষমতা এবং V3.1 স্থাপনের পরে পরিষেবা স্কেলিং।
কোম্পানিটি এই সংস্করণটিকে তার আপডেট সময়সূচীর সাথে সংযুক্ত করে, এর উন্নতির পরে R1 মে মাসে এবং সিরিজের প্রথম বিবর্তন V3 মার্চ মাসে। প্রযুক্তিগতভাবে, বাস্তুতন্ত্রের উৎসগুলি একটি সাধারণ স্থাপত্যের বর্ণনা দেয় বিশেষজ্ঞদের মিশ্রণ কোটি কোটি প্যারামিটার সহ প্রতি টোকেন সম্পদ, গুণমানকে ত্যাগ না করে সম্পদের সর্বোত্তমকরণের লক্ষ্যে।
V3.1 একটি স্পষ্ট বার্তা রেখে যায়: একটি মডেল হাইব্রিড অনুমান, প্রশিক্ষিত এবং সুরক্ষিত UE8M0 FP8 সম্পর্কে, যা এর সাথে সামঞ্জস্য পরীক্ষা করে চাইনিজ চিপসের পরবর্তী ঢেউ এবং যা API এর মাধ্যমে প্রেক্ষাপট এবং প্রাপ্যতার উন্নতির সাথে আসে। যদি হার্ডওয়্যার এটিকে সমর্থন করে এবং নেটিভ FP8 প্রদান করে, তাহলে চীনে AI কোথায় যাচ্ছে তা নিয়ে আলোচনার ফোকাস পরিবর্তন হতে পারে, যার ফলে বিশ্বব্যাপী প্রতিযোগিতা এবং সরবরাহ শৃঙ্খলে নেতিবাচক প্রভাব পড়বে।