
যদি আপনি BrowserOS সম্পর্কে শুনে থাকেন এবং ভেবে থাকেন কেন এত মানুষ "মস্তিষ্ক বিশিষ্ট ব্রাউজার" নিয়ে কথা বলছে, তাহলে এখানে সম্পূর্ণ ছবি দেওয়া হল। BrowserOS হল একটি ওপেন-সোর্স ব্রাউজার যা প্রাকৃতিক ভাষায় নির্দেশাবলী বুঝতে এবং কার্যকর করতে সক্ষম AI এজেন্টদের অন্তর্ভুক্ত করে।আপনার লগ-ইন করা সেশন এবং স্থানীয় অ্যাক্সেস ব্যবহার করে আপনার পক্ষে ক্লিক করা, টাইপ করা এবং ব্রাউজ করা। এই সবকিছুই একটি গোপনীয়তা-বাই-ডিফল্ট পদ্ধতির মাধ্যমে এবং আপনার ব্যক্তিগত ডেটার জন্য ক্লাউড পরিকাঠামোর উপর নির্ভর না করেই।
এই প্রস্তাবটি ব্রাউজারের জগতে কেবল আরেকটি এলোমেলো ধারণা নয়: ব্রাউজারওএসের জন্ম ক্রোমিয়ামের একটি কাঁটা হিসেবে, আপনার ক্রোম এক্সটেনশনের জন্য সামঞ্জস্যপূর্ণতা এবং একটি স্পষ্ট উদ্দেশ্য সহ: এর মতো সমাধানের একটি উন্মুক্ত এবং গোপনীয়তা-কেন্দ্রিক বিকল্প হতে অ্যাটলাস (চ্যাটজিপিটি)ধূমকেতু (জটিলতা) অথবা দিয়া, ঐতিহ্যবাহী ব্রাউজার ছাড়াও। ধারণাটি ব্যাখ্যা করা সহজ এবং এর প্রভাবে শক্তিশালী: আপনি কাজটি বর্ণনা করেন এবং একজন এজেন্ট আপনার নিজের কম্পিউটার থেকে, আপনার শংসাপত্র সহ এবং তৃতীয় পক্ষের কাছে আপনার ইতিহাস না পাঠিয়েই এটি সম্পাদন করে।
BrowserOS কী এবং এটি কীভাবে আলাদা?
সংক্ষেপে, BrowserOS হল এমন একটি ব্রাউজার যা নেটিভভাবে AI এজেন্ট চালায়।এটি আপনাকে এমনভাবে নির্দেশাবলী লিখতে দেয় যেন আপনি কোনও সহকর্মীকে সেগুলি ব্যাখ্যা করছেন, এবং সিস্টেমটি ক্রমানুসারে ক্রিয়া সম্পাদনের যত্ন নেয়: পৃষ্ঠা খোলা, অনুসন্ধান শুরু করা, ফর্ম পূরণ করা, বা ডেটা বের করা। এটি কোনও বহিরাগত সহকারী নয় যা আপনার ব্রাউজারকে "দেখে": এজেন্টরা BrowserOS-এর মধ্যেই থাকে।
কারণ এটি ক্রোমিয়ামের উপর নির্মিত, প্রথম মিনিট থেকেই অভিজ্ঞতাটি পরিচিত মনে হচ্ছে।একটি পরিচিত ইন্টারফেস, এক্সটেনশনের সাথে সামঞ্জস্য, Chrome ডেটা আমদানি, এবং যারা ইতিমধ্যেই বাস্তুতন্ত্রের সাথে পরিচিত তাদের জন্য কার্যত তাৎক্ষণিক গ্রহণ। দৈনন্দিন ব্যবহারের ক্ষয়ক্ষতি ছাড়াই স্বয়ংক্রিয়ভাবে কাজ শুরু করার সময় "বাড়ির মতো অনুভূতি" প্রভাবটি ঘর্ষণ কমায়।
এখন কেন: ব্রাউজারে এজেন্টদের সময় এসেছে
সাম্প্রতিক মাসগুলিতে, AI-সহায়তাপ্রাপ্ত প্রোগ্রামিং সরঞ্জামগুলি ডেভেলপারদের উৎপাদনশীলতা বহুগুণ বাড়িয়েছে। তবে, লক্ষ লক্ষ জ্ঞান কর্মী বারবার ব্রাউজারের কাজে আটকে আছেন।কপি-পেস্ট করা, ফর্ম পূরণ করা, ড্যাশবোর্ড ডেটা রপ্তানি করা, প্রচারণা শুরু করা ইত্যাদি। এটি একটি নিত্যদিনের বাধা।
ব্রাউজারওএস টিম পরামর্শ দিচ্ছে যে, নেটস্কেপের দিনগুলির পর প্রথমবারের মতো, আমাদের কাছে বাস্তব কাজের জন্য ব্রাউজারটিকে পুনরায় কল্পনা করার সুযোগ রয়েছে।যদি AI ইতিমধ্যেই সম্পূর্ণ প্রকল্প "লিখে" থাকে, তাহলে কেন এটি আপনার মতো বোতাম টিপতে, ওয়েব ইন্টারফেস নেভিগেট করতে বা ক্রিয়াগুলিকে একত্রিত করতে পারে না, কিন্তু সর্বদা আপনার নিয়ন্ত্রণে না থেকে?
BrowserOS যেসব সমস্যা মোকাবেলা করে
BrowserOS-এর আগে, বাস্তব জগতের কাজে এজেন্টদের মোতায়েন খুব নির্দিষ্ট কারণে ব্যর্থ হয়েছিল। প্রকল্পটি তিনটি প্রধান বাধা চিহ্নিত করে যা এর ব্যাপক গ্রহণকে বাধাগ্রস্ত করে।বিশেষ করে কোম্পানিগুলিতে:
- প্রমাণিত সেশনে অ্যাক্সেসঅনেক এজেন্ট সলিউশন দূরবর্তী মেশিনে চলে এবং আপনার আসল অ্যাকাউন্ট (Gmail, LinkedIn, কর্পোরেট টুলস) দিয়ে কাজ করতে পারে না। ফলস্বরূপ, তারা বাস্তব-জগতের কাজে ব্যর্থ হয়।
- টুল ফ্র্যাগমেন্টেশনকিছু এজেন্ট MCP সার্ভারের সাথে যোগাযোগ করে, অন্যরা কেবল ওয়েব অটোমেশন করে, এবং অন্যরা Zaps এর মতো API গুলিকে একসাথে চেইন করে। যা অনুপস্থিত তা হল জটিল প্রবাহ তৈরির জন্য একটি একীভূত "টুলবক্স"।
- কালো বাক্স এবং তালাবেশ কিছু জনপ্রিয় ব্রাউজার হল অনুসন্ধান বা বিজ্ঞাপনের পণ্য। তারা তাদের প্রম্পট বা তাদের অভ্যন্তরীণ কাজকর্ম খোলে না।তারা আপনাকে তাদের সার্ভারে একটি নির্দিষ্ট LLM এবং রুট ডেটা বরাদ্দ করে। অনেক কোম্পানির জন্য, এটি একটি নির্দিষ্ট সংখ্যা।
BrowserOS শুরু থেকেই সাড়া দেয়: আপনার ব্রাউজারের মধ্যে থাকা এজেন্ট, আপনার কম্পিউটারে চলমানএমসিপি এবং অটোমেশনের সমন্বয়, এবং ১০০% উন্মুক্ত দর্শনের অধীনে যা আপনি যখনই চান অডিট এবং ফোর্ক করতে পারেন, এই সমন্বয়টি এখন পর্যন্ত ব্রাউজারে এআই-এর কাছে গুরুতর কাজ অর্পণ করা অসম্ভব করে তুলেছিল এমন সমস্যার সমাধান করে।
ব্রাউজারওএস কীভাবে কাজ করে এবং প্রথম পদক্ষেপ
প্রবাহটি সরাসরি: আপনি অন্য যেকোনো ব্রাউজারের মতোই BrowserOS ডাউনলোড এবং ইনস্টল করেনআপনি প্রতিদিন যে সাইটগুলি ব্যবহার করেন সেগুলিতে লগ ইন করেন এবং সেখান থেকে স্বাভাবিক ভাষায় কাজগুলি বর্ণনা করেন। এজেন্ট আপনার বাস্তব-বিশ্বের প্রেক্ষাপটে, আপনার অনুমতি এবং সক্রিয় সেশনের মাধ্যমে কাজ করে, যেন আপনি স্ক্রিনের সামনে আছেন।
- ডাউনলোড এবং ইনস্টলেশন আপনার সিস্টেমের জন্য BrowserOS (macOS, Windows এবং Linux এর জন্য উপলব্ধ)। যদি আপনি Linux এ ইনস্টলেশন সম্পর্কে উদ্বিগ্ন হন, তাহলে এটি একটি AppImage হিসাবে উপলব্ধ। গিটহাবে.
- আপনার Chrome ডেটা আমদানি করুন যদি আপনি বুকমার্ক, ইতিহাস, অথবা সেটিংস রাখতে আগ্রহী হন।
- আপনার AI প্রদানকারীর সাথে সংযোগ স্থাপন করুন: OpenAIওল্লামা/এলএম স্টুডিওর মাধ্যমে অ্যানথ্রোপিক বা স্থানীয় মডেল, আপনার নিজস্ব চাবি সহ।
- স্বয়ংক্রিয়করণ শুরু করুন: টেক্সটে লক্ষ্য নির্ধারণ করুন এবং এজেন্টকে ওয়েবে ধাপগুলি কার্যকর করতে দিন।
আপনিও পারেন MCP সার্ভারের সাথে ব্রাউজার অটোমেশন একত্রিত করুন এবং একই প্রবাহে API কল। এই সমন্বয় আপনাকে এমন সহকারী তৈরি করতে দেয় যা ডেটা স্ক্র্যাপ করতে, একটি মডেলে প্রক্রিয়াকরণ করতে এবং স্প্রেডশিট বা SaaS টুল আপডেট করতে সক্ষম, সবই একটি একক এজেন্ট দ্বারা একসাথে শৃঙ্খলিত।
BrowserOS এর মূল বৈশিষ্ট্যগুলি যা পার্থক্য তৈরি করে
- প্রাকৃতিক ভাষায় নির্মাণকারী এজেন্টপ্রোগ্রামিং ছাড়াই তুমি যা ইচ্ছা বলো।
- মডেলদের স্বাধীনতাতোমার চাবিগুলো নিয়ে এসো এবং LLM গুলোর মধ্যে স্যুইচ করো, অথবা স্থানীয় মডেলগুলো চালাও।
- এটি একটি "সাধারণ" ব্রাউজার।: ক্রোমিয়াম বেস, আপনার Chrome এক্সটেনশনগুলি কি কাজ করে?.
গোপনীয়তা হল নকশার একটি স্তম্ভ: আপনার ডেটা, ইতিহাস এবং সেশনগুলি আপনার কম্পিউটারে থেকে যায়।আক্রমণাত্মক টেলিমেট্রি বা বহিরাগত মেঘের উপর নির্ভরতা ছাড়াই। আপনি যদি চান, আপনি স্থানীয় মডেলগুলির সাথে একচেটিয়াভাবে কাজ করতে পারেন এবং ট্যাপটি সম্পূর্ণরূপে বন্ধ করে দিতে পারেন।
এবং যদি এটি যথেষ্ট না ছিল, তারা একটি AI-চালিত বিজ্ঞাপন ব্লকার নিয়ে কাজ করছে যা স্ট্যাটিক ফিল্টারের চেয়ে জটিল পরিস্থিতি কভার করার প্রতিশ্রুতি দেয়। এবং, ডেভেলপার এবং পাওয়ার ব্যবহারকারীদের জন্য, ব্রাউজারটিকে একটি MCP সার্ভার হিসাবে ব্যবহারের জন্য সমর্থন রয়েছে, এটিকে সরঞ্জামগুলির সাথে একীভূত করা যেমন claude-code o gemini-cli.
ইন্টিগ্রেশন, এমসিপি এবং বহিরাগত সরঞ্জাম থেকে ব্যবহার
এর সবচেয়ে শক্তিশালী সম্পদগুলির মধ্যে একটি হল যে ব্রাউজারওএস একটি এমসিপি সার্ভার হিসেবে কাজ করতে পারেএর অর্থ হল প্রোটোকলের সাথে সামঞ্জস্যপূর্ণ অন্যান্য অ্যাপ্লিকেশন (যেমন উল্লেখিত) claude-code o gemini-cliতারা আপনার ব্রাউজারের সাথে "কথা বলতে" পারে এবং তাদের এজেন্টদের কাছে ওয়েব ইন্টারফেসের কাজগুলি অর্পণ করতে পারে।
আকর্ষণীয় বিষয় হল অর্কেস্ট্রেশন: আপনাকে ব্রাউজারটি স্বয়ংক্রিয় করা বা একটি API কল করার মধ্যে বেছে নেওয়ার দরকার নেই।আপনি একই এজেন্ট রেসিপিতে উভয়ই করতে পারেন। উদাহরণস্বরূপ, একটি জটিল UI সহ একটি পোর্টাল থেকে ডেটা বের করুন, একটি মডেল দিয়ে এটি প্রক্রিয়া করুন এবং তারপর ফলাফলটি একটি স্প্রেডশিট বা CRM-এ লোড করুন, ম্যানুয়ালি টুল মিক্স না করে।
ক্রোম, ব্রেভ, আর্ক/ডায়া এবং পারপ্লেক্সিটি ধূমকেতুর সাথে দ্রুত তুলনা
ক্রোমের সাথে তুলনা করা হয়েছে
Chromium এর ওপেন সোর্সের জন্য ধন্যবাদ, BrowserOS ভিত্তিটি উত্তরাধিকারসূত্রে পেয়েছে, কিন্তু বহু বছর ধরে Chrome অটোমেশনের জন্য বড় ধরনের নেটিভ AI অগ্রগতি ছাড়াই কাজ করছে।এমসিপি ছাড়া, স্থানীয় এজেন্ট ছাড়া, সেই সমন্বিত অর্কেস্ট্রেশন স্তর ছাড়া, এটি কেবল একটি দুর্দান্ত ব্রাউজারই থেকে যায়... "ক্লিক-ফর-ইউ সহকারী" ছাড়া।
সাহসী মুখোমুখি
সাহসী একান্তে পথ তৈরি করেছিল, কিন্তু তাদের ফোকাস ক্রিপ্টো, অনুসন্ধান, ভিপিএন এবং আরও অনেক কিছুর মধ্যে বিভক্ত।BrowserOS তার নিজস্ব কাজ করছে: ব্রাউজারে AI এবং বাস্তব কাজের অটোমেশন।
আর্ক/ডায়ার মুখোমুখি
অনেকেই আর্কের প্রস্তাবের প্রশংসা করেছেন, কিন্তু এটি তার কোড বন্ধ করে দেয় এবং ব্যবহারকারীদের অনিশ্চয়তার মধ্যে ফেলে দেয়।BrowserOS-এ এটি ঠিক বিপরীত: ১০০% উন্মুক্ত, নিরীক্ষণযোগ্য, ফোরকেবল, একটি জড়িত সম্প্রদায়ের সাথে এবং কোনও একক প্রদানকারীর উপর নির্ভরতা ছাড়াই।
জটিলতার মুখোমুখি ধূমকেতু
জটিলতা, শেষ পর্যন্ত, একটি অনুসন্ধান এবং বিজ্ঞাপন সংস্থা। আপনার ইতিহাস একটি পণ্য হয়ে উঠতে পারেBrowserOS-এ, প্রতিশ্রুতি স্পষ্ট: স্থানীয় ডেটা এবং আপনার পক্ষ থেকে সম্পূর্ণ নিয়ন্ত্রণ।
নিরাপত্তা, গোপনীয়তা এবং লাইসেন্সিং
দর্শনটি হল "গোপনীয়তা-প্রথমে": আপনি Ollama/LM Studio-এর সাথে আপনার নিজস্ব API কী অথবা স্থানীয় মডেল ব্যবহার করেনআপনার ডিভাইসে কোনটি থাকবে এবং কোনটি থাকবে না তা আপনি বেছে নেন এবং আপনি ইতিহাস এবং সেশনগুলিকে তৃতীয় পক্ষের নাগালের বাইরে রাখেন।
আইনি এবং সামাজিক স্তরে, BrowserOS হল AGPL-3.0 এর অধীনে লাইসেন্সপ্রাপ্ত বিনামূল্যের সফটওয়্যার।আপনি এটি কীভাবে তৈরি করা হয়েছে তা দেখতে পারেন, সিস্টেমের প্রম্পট পর্যালোচনা করতে পারেন, পরিবর্তন প্রস্তাব করতে পারেন, প্রকল্পটি তৈরি করতে পারেন এবং অবদান রাখতে পারেন। এই সবকিছুই এর নির্মাতাদের দ্বারা উল্লেখিত "সান ফ্রান্সিসকো থেকে ভালোবাসা দিয়ে তৈরি" চেতনার সাথে।
সম্প্রদায়, পরিসংখ্যান এবং প্রকল্পের গতি
আগ্রহ স্পষ্ট। এটি GitHub-এ ৪.৩ হাজারেরও বেশি স্টার, ২৫,০০০+ ডাউনলোড এবং এক হাজারেরও বেশি ডিসকর্ড সম্প্রদায় নিয়ে গর্ব করে। সক্রিয়ভাবে অংশগ্রহণকারী মানুষের সংখ্যা। আরেকটি অংশে, "6,3k" এবং "558" এর মতো মেট্রিক্স দেখা যাচ্ছে (ভান্ডারের সাথে সম্পর্কিত, সম্ভবত তারা/অনুসারী/শাখা), যা ঊর্ধ্বমুখী প্রবণতার ইঙ্গিত দেয়।
টেকনিক্যালি, প্রকল্পটি তার ভিত্তির জন্য আলাদাভাবে দাঁড়িয়ে আছে বিশাল ক্রোমিয়ামের উপরে C++, একটি কঠিন যাত্রা যার জন্য প্রচুর পরিশ্রম এবং আপস্ট্রিম পরিবর্তনের সাথে সামঞ্জস্য বজায় রাখার পাশাপাশি এজেন্ট স্তরে উদ্ভাবন অব্যাহত রাখতে হবে।
ব্যবহারের কেস এবং ডেমো
বাস্তব জগতের কাজগুলো সম্পর্কে ভাবুন: আপনার লিঙ্কডইন অ্যাপ্লিকেশনগুলির মধ্যে আগ্রহের প্রোফাইলগুলি সনাক্ত করুন এবং সেগুলি একটি গুগল শিটে যুক্ত করুন।লম্বা ফর্ম পূরণ করুন, একাধিক ওয়েবসাইট থেকে তথ্য সংগ্রহ করুন, অথবা একটি সভার জন্য গুরুত্বপূর্ণ তথ্য সহ একটি প্রাক-ব্রিফিং প্রস্তুত করুন। আপনি এটি টেক্সটে বর্ণনা করেন, এবং এজেন্ট আপনার মতো করে নেভিগেট করে এবং কাজ করে।
ধারণাটিকে বাস্তবে দেখানোর জন্য অডিওভিজুয়াল উপাদান রয়েছে: “HackerNews.top.3.mp4”, “use-browserOS-to-chat.mp4” অথবা “use-browserOS-to-extract.mp4” এর মতো ডেমো তারা বাস্তব-বিশ্বের সেটিংসে সহায়ক কথোপকথন থেকে শুরু করে ডেটা নিষ্কাশন পর্যন্ত সবকিছু শেখায়, যা আরও জোরদার করে যে অটোমেশন আপনার প্রকৃত প্রেক্ষাপটে ঘটে।
দৃষ্টি: এজেন্টদের জন্য একটি "অপারেটিং সিস্টেম" হিসেবে ব্রাউজার
কোম্পানিগুলি ব্রাউজারে বাস করে: সেলসফোর্স, এসএপি, কর্মদিবস, অভ্যন্তরীণ সরঞ্জাম... জ্ঞান কর্মীদের একটি বাহিনী তাদের দিনের ৬০-৮০% সময় ওয়েব অ্যাপে ব্যয় করেযদি একজন এজেন্ট একজন ব্যক্তির মতো ক্লিক এবং টাইপ করতে পারে, তাহলে এটি কার্যত যেকোনো ইন্টারফেস স্বয়ংক্রিয় করতে পারে, এমনকি API ছাড়া ইন্টারফেসও।
প্রকল্পটি যে দৃষ্টিভঙ্গি উপস্থাপন করেছে তা হল আইটি পুনর্ব্যবহারযোগ্য "কর্মচারী-এজেন্ট" মোতায়েন করতে পারেকোম্পানির "ব্যয় এজেন্ট", কমিউনিটি-শেয়ার্ড "ফেসবুক বিজ্ঞাপন এজেন্ট" যাকে আপনি আপনার কর্মপ্রবাহের সাথে খাপ খাইয়ে নেন, ইত্যাদি। কম যান্ত্রিক কাজ, মূল্য বৃদ্ধির উপর বেশি মনোযোগ।
BrowserOS এর পিছনে কে আছে?
এই প্রকল্পের মূল লক্ষ্য দুই যমজ ভাই, যাদের বিগ টেকে একটি গুরুত্বপূর্ণ অভিজ্ঞতা রয়েছে। নিখিল C++ এবং সিস্টেম ব্যবহার করে রিলসের ব্যাকএন্ড এবং ফেসবুক ফিডে কাজ করেছেন।নিতিন ইউটিউবে একজন এমএল ইঞ্জিনিয়ার ছিলেন, প্ল্যাটফর্মের প্রথম প্রধান সুপারিশ মডেলে (এলআরএম) অংশগ্রহণ করেছিলেন। এই মিশ্রণ নিম্ন স্তরের এবং AI স্তর তাদের Chromium এর সাথে মোকাবিলা করার স্বাধীনতা দেয় এবং একই সাথে, এর উপরে "এজেন্ট ব্রেন" তৈরি করে।
- C++ এবং বৃহৎ-স্কেল সিস্টেমে অভিজ্ঞতা।: গুরুত্বপূর্ণ এবং উচ্চ-কার্যক্ষমতাসম্পন্ন পরিষেবাগুলির রক্ষণাবেক্ষণ।
- এমএল এবং সুপারিশকারী সিস্টেমে বিশেষজ্ঞতা: আধুনিক মডেল এবং তাদের স্থাপনার গভীর ধারণা।
সম্প্রদায়ের মতামত এবং কম পরিচিত বিকল্পগুলি
উন্নত ব্যবহারকারীদের মধ্যে সম্ভাবনাময় "ভিন্ন" ব্রাউজারগুলির প্রতি আগ্রহ রয়েছে। ওয়েভবক্স, উলা, আর্ক, ঘোস্ট ব্রাউজার বা থোরিয়ামের মতো বিকল্পগুলি পরীক্ষা করা হয়েছে।জেন ব্রাউজারটি তার উৎপাদনশীলতার জন্য প্রশংসিত (যদিও এটি ক্রোমিয়াম-ভিত্তিক নয়)। এই পরীক্ষাগুলিতে উল্লেখ করা হয়েছে যে ওয়েভবক্স খুবই বিস্তৃত কিন্তু অপ্রতিরোধ্য হতে পারে এবং এটিকে সম্পূর্ণ সম্ভাবনায় আনলক করা সময়সাপেক্ষ; উলা গোপনীয়তা নিয়ে গর্ব করে কিন্তু এতে অনেক অতিরিক্ত বৈশিষ্ট্য রয়েছে; আর্ক মিশ্র প্রতিক্রিয়া তৈরি করেছে; এবং ঘোস্ট ব্রাউজার সবার মন জয় করতে পারেনি।
থোরিয়াম সম্পর্কে শোনা যায় যে এটি খুব দ্রুত কিন্তু কিছু নিরাপত্তা উদ্বেগের সাথে।এই কারণেই কিছু লোক এটি স্থগিত করে। এবং প্রায়শই, সুপারিশ করা হয় যে সর্বাধিক পরিচিতগুলি বেছে না নেওয়া উচিত কারণ তারা ইতিমধ্যে প্রায় বিশটি চেষ্টা করে দেখেছেন, এবং লক্ষ্য হল এমন বিরল জিনিস আবিষ্কার করা যা সত্যিই নতুন কিছু প্রদান করে।
এজেন্ট ব্যবহারের সংক্ষিপ্ত নির্দেশিকা
একবার ভেতরে ঢুকলে, "জাদুকরী মুহূর্ত" আসে যখন আপনি আসল কাজগুলি বর্ণনা করেন। "এটিকে অমুক অমুক খুঁজতে" বলার এবং একটি সারাংশ ফেরত দেওয়ার পরিবর্তে, এজেন্ট আপনার ব্রাউজারে ইন্টারঅ্যাকশনটি সম্পাদন করে।যদি ওয়েবসাইটটিতে API না থাকে, তাহলে তাতে কিছু আসে যায় না: একটি UI আছে, এমন কিছু ক্রিয়া আছে যা একজন এজেন্ট সঠিকভাবে প্রতিলিপি করতে পারে।
- তোমার উদ্দেশ্য বর্ণনা করো।উদাহরণস্বরূপ, একটি পেশাদার নেটওয়ার্কে নির্দিষ্ট পরিচিতিগুলি সনাক্ত করা এবং তাদের তথ্য একটি স্প্রেডশিটে স্থানান্তর করা।
- ধাপগুলি নিশ্চিত করুন যদি এজেন্ট আপনাকে সেগুলি সুপারিশ করে (তিনি কী করবেন তা নিরীক্ষণের জন্য কার্যকর)।
- প্রথমবার তত্ত্বাবধান করুন প্রম্পট বা নিয়মগুলি সামঞ্জস্য করতে, তারপর রেসিপিটি পুনরায় ব্যবহার করুন।
MCP এর ব্যবহার এবং অটোমেশন, API এবং মডেলগুলিকে "সেলাই" করার ক্ষমতা এটিকে সম্ভব করে তোলে একটি একক এজেন্ট সম্পূর্ণ এন্ড-টু-এন্ড প্রক্রিয়াগুলি সমাধান করে, এমন কিছু যা আগে ডাক্ট টেপের সাথে একাধিক সরঞ্জাম একসাথে টেপ করার প্রয়োজন হত।
নকশা এবং মডেল নিয়ন্ত্রণ অনুসারে গোপনীয়তা
একটি গুরুত্বপূর্ণ সুবিধা হল AI ইঞ্জিন বেছে নেওয়ার স্বাধীনতা। আপনি OpenAI, Anthropic এর সাথে কাজ করতে পারেন, অথবা Ollama/LM Studio এর সাথে সবকিছু স্থানীয় রাখতে পারেন।খরচ, বিলম্ব, অথবা প্রকল্পের সংবেদনশীলতার উপর ভিত্তি করে রুটটি সামঞ্জস্য করা হয়। যারা পরম গোপনীয়তাকে অগ্রাধিকার দেন তাদের ১০০% স্থানীয় রুট থাকে।
উপরন্তু, প্রকল্পটি সিস্টেম প্রম্পট প্রকাশ করে এবং সম্পাদনা করার অনুমতি দেয়।এটি অস্বাভাবিক। এই স্বচ্ছতার ফলে এজেন্টের আচরণ আপনার প্রতিষ্ঠান বা নির্দিষ্ট ক্ষেত্রে সামঞ্জস্য করা এবং তারা কীভাবে সিদ্ধান্ত নেয় তা নিরীক্ষণ করা সহজ হয়।
BrowserOS প্রকল্পে অবদান রাখার পদক্ষেপ
আপনি যদি এই ধারণায় বিশ্বাস করেন এবং সাহায্যের হাত বাড়াতে চান, তাহলে এটিকে সমর্থন করার বিভিন্ন উপায় রয়েছে। GitHub-এ একটি তারকা চিহ্ন দিন এটি দৃশ্যমানতা বৃদ্ধিতে সাহায্য করে; এটি ডাউনলোড এবং ব্যবহার আকর্ষণীয় টেলিমেট্রি (যদি আপনি এটি সক্রিয় করেন) এবং প্রতিক্রিয়া প্রদান করে; এবং ডিসকর্ডে যোগদান আপনাকে নতুন বৈশিষ্ট্যগুলি প্রস্তাব, আবিষ্কার এবং পরীক্ষা করার সুযোগ দেয়।
অবশেষে, অফিসিয়াল ওয়েবসাইট সাধারণত একটি অনুস্মারক প্রদর্শন করে আপনার সিস্টেমের জন্য ব্রাউজারটি ডাউনলোড করুন।আপনি চাইলে আপনার Chrome ডেটা আমদানি করতে পারেন এবং আপনার পছন্দের AI প্রদানকারীর সাথে সংযোগ স্থাপন করতে পারেন। সেখান থেকে, এটি কেবল আপনার এজেন্ট তৈরি করা এবং আপনার জন্য কী কাজ করে তা ভাগ করে নেওয়ার বিষয়।
পুরো ছবিটি দেখলে, BrowserOS নিজেকে একটি হিসাবে প্রতিষ্ঠিত করছে এজেন্ট-কেন্দ্রিক পদ্ধতির সাথে ওপেন সোর্স ব্রাউজার, গোপনীয়তাকে অগ্রাধিকার দেওয়া, Chromium-ভিত্তিক এবং ক্রমবর্ধমান সম্প্রদায়ের সাথে।এটি এক্সটেনশন, MCP, স্থানীয় মডেলগুলির জন্য সমর্থন (Ollama/LM Studio) এবং একটি উন্মুক্ত প্রতিশ্রুতির সাথে সামঞ্জস্যপূর্ণ, যার মধ্যে একটি AGPL-3.0 লাইসেন্স এবং সম্পাদনাযোগ্য প্রম্পট অন্তর্ভুক্ত রয়েছে। Chrome, Brave, Arc/Dia, বা অন্যান্য বিজ্ঞাপন- এবং অনুসন্ধান-চালিত অফারগুলির বিপরীতে, এটির লক্ষ্য হল AI-এর "জাদু" সরাসরি সেই সাইটে নিয়ে আসা যেখানে আপনি প্রতিদিন কাজ করেন। এবং যদিও এখনও কিছু বিশদ বিবরণ পালিশ করার আছে (যেমন একটি AI-চালিত বিজ্ঞাপন ব্লকার যা শীঘ্রই আসছে, অথবা Windows-এ মাঝে মাঝে ইনস্টলেশন সমস্যা), গতি এবং ব্যবহারকারীর অংশগ্রহণ এমন একটি প্রকল্পের দিকে ইঙ্গিত করে যা সান ফ্রান্সিসকোতে প্রেমের সাথে নির্মিত এবং ওয়েবকে কেবল ক্লিকের শৃঙ্খল থেকে, অবশেষে, এজেন্টদের জন্য একটি প্ল্যাটফর্মে রূপান্তরিত করার ইচ্ছা নিয়ে যা আপনার সাথে কাজ করে।