8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প

উত্স নোড: 2050235

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
লেখকের ছবি

সার্জারির এলএলএএমএ প্রকল্পটি মৌলিক ভাষার মডেলগুলির একটি সেটকে অন্তর্ভুক্ত করে যা আকারে 7 বিলিয়ন থেকে 65 বিলিয়ন পরামিতিগুলির মধ্যে পরিবর্তিত হয়। এই মডেলগুলি লক্ষ লক্ষ টোকেনগুলির প্রশিক্ষণ ছিল এবং এটি একচেটিয়াভাবে সর্বজনীনভাবে উপলব্ধ ডেটাসেটের প্রশিক্ষণ ছিল৷ ফলস্বরূপ, LLaMA-13B GPT-3 (175B) কে ছাড়িয়ে গেছে এবং LLaMA-65B চিনচিলা-70B এবং PaLM-540B-এর মতো সেরা মডেলগুলির মতোই পারফর্ম করছে৷

 

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
চিত্র থেকে এলএলএএমএ 
 

সম্পদ:  

স্ট্যানফোর্ড আলপাকা দাবি করে যে এটি ChatGPT এর সাথে প্রতিদ্বন্দ্বিতা করতে পারে এবং যে কেউ এটিকে 600 ডলারেরও কম সময়ে পুনরুত্পাদন করতে পারে। আলপাকা 7B 7K নির্দেশনা-অনুসরণকারী প্রদর্শনের উপর LLaMA 52B মডেল থেকে সুন্দর করা হয়েছে। 

 

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
প্রশিক্ষণ রেসিপি | ছবি থেকে স্ট্যানফোর্ড সিআরএফএম
 

সম্পদ:  

ভিকুনা থেকে সংগৃহীত ব্যবহারকারী-ভাগ করা কথোপকথনের উপর LLaMA মডেল থেকে ফাইনটিউন করা হয়েছে জিপিটি শেয়ার করুন. Vicuna-13B মডেলটি OpenAI ChatGPT এবং Google Bard-এর 90%*-এর বেশি গুণমান অর্জন করেছে। এটি 90% ক্ষেত্রে এলএলএএমএ এবং স্ট্যানফোর্ড আলপাকা মডেলকেও ছাড়িয়ে গেছে। ভিকুনা প্রশিক্ষণের খরচ ছিল প্রায় 300 ডলার।

 

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
চিত্র থেকে ভিকুনা
 

সম্পদ:  

OpenChatKit: ওপেন-সোর্স চ্যাটজিপিটি বিকল্প আপনার চ্যাটবট তৈরি করার জন্য একটি সম্পূর্ণ টুল কিট। এটি আপনার নিজস্ব নির্দেশ-সুরিত বৃহৎ ভাষার মডেল প্রশিক্ষণের জন্য নির্দেশনা প্রদান করে, মডেলটি সূক্ষ্ম-টিউনিং, বট প্রতিক্রিয়া আপডেট করার জন্য এক্সটেনসিবল পুনরুদ্ধার ব্যবস্থা এবং প্রশ্নগুলি ফিল্টার করার জন্য বট সংযম। 

 

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
চিত্র থেকে একসাথে
 

আমরা দেখতে পাচ্ছি, GPT-NeoXT-Chat-Base-20B মডেলটি প্রশ্নোত্তর, নিষ্কাশন এবং শ্রেণীবিভাগের কাজগুলিতে বেস মোড GPT-NoeX কে ছাড়িয়ে গেছে। 

সম্পদ:  

GPT4ALL এটি একটি সম্প্রদায়-চালিত প্রকল্প এবং কোড, গল্প, চিত্রণ এবং বহু-পালা সংলাপ সহ সহকারী মিথস্ক্রিয়াগুলির একটি বিশাল কিউরেটেড কর্পাসের উপর প্রশিক্ষিত হয়েছিল৷ দলটি ওপেন সোর্স প্রচারের জন্য ডেটাসেট, মডেল ওজন, ডেটা কিউরেশন প্রক্রিয়া এবং প্রশিক্ষণ কোড সরবরাহ করেছে। উপরন্তু, তারা আপনার ল্যাপটপে চলতে পারে এমন মডেলের কোয়ান্টাইজড 4-বিট সংস্করণ প্রকাশ করেছে। এমনকি আপনি মডেল অনুমান চালানোর জন্য একটি পাইথন ক্লায়েন্ট ব্যবহার করতে পারেন। 

 

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
থেকে জিআইএফ GPT4ALL 
 

সম্পদ:  

রেভেন RWKV 7B একটি ওপেন সোর্স চ্যাটবট যা দ্বারা চালিত হয় RWKV ভাষা মডেল যা ChatGPT-এর অনুরূপ ফলাফল তৈরি করে। মডেলটি RNN ব্যবহার করে যা ট্রান্সফরমারগুলিকে মান এবং স্কেলিংয়ে মেলে যখন দ্রুত এবং VRAM সংরক্ষণ করে। র্যাভেন স্ট্যানফোর্ড আলপাকা, কোড-আলপাকা এবং আরও ডেটাসেটগুলিতে সূক্ষ্ম সুর করা হয়েছিল।

 

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
চিত্র থেকে রেভেন RWKV 7B 
 

সম্পদ:  

বেছে নেত্তয়া: ওপেন প্রাক-প্রশিক্ষিত ট্রান্সফরমার ল্যাঙ্গুয়েজ মডেলগুলি চ্যাটজিপিটি হিসাবে দুর্দান্ত নয়, তবে এটি শূন্য- এবং কয়েক-শট শেখার এবং স্টেরিওটাইপিকাল বায়াস বিশ্লেষণের জন্য অসাধারণ ক্ষমতা দেখিয়েছে। আরও ভাল ফলাফল পেতে আপনি এটিকে আলপা, কলোসাল-এআই, CTranslate2 এবং FasterTransformer-এর সাথে সংহত করতে পারেন। 

বিঃদ্রঃ: এটির জনপ্রিয়তার কারণে এটি তালিকায় রয়েছে, কারণ এটির পাঠ্য প্রজন্ম বিভাগে 624,710টি মাসিক ডাউনলোড রয়েছে। 

 

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
চিত্র থেকে (arxiv.org)
 

সম্পদ:  

Flan-T5-XXL সূক্ষ্ম টিউন করা ডেটাসেটের সংগ্রহে T5 মডেল নির্দেশাবলী হিসাবে বাক্যাংশ। নির্দেশনা ফাইন-টিউনিং নাটকীয়ভাবে বিভিন্ন মডেল ক্লাস যেমন PaLM, T5, এবং U-PaLM এর কর্মক্ষমতা উন্নত করে। Flan-T5-XXL মডেলটি 1000টিরও বেশি অতিরিক্ত টাস্কের সাথে আরও বেশি ভাষা কভার করে। 

 

8 ওপেন সোর্স চ্যাটজিপিটি এবং বার্ডের বিকল্প
চিত্র থেকে Flan-T5-XXL
 

সম্পদ:  

অনেকগুলি ওপেন সোর্স বিকল্প উপলব্ধ রয়েছে এবং আমি জনপ্রিয়গুলির উল্লেখ করেছি। ওপেন-সোর্স চ্যাটবট এবং মডেলগুলি আরও ভাল হচ্ছে, এবং আগামী কয়েক মাসে, আপনি একটি নতুন মডেল দেখতে পাবেন যা পারফরম্যান্সের দিক থেকে ChatGPT-কে সম্পূর্ণভাবে ছাড়িয়ে যেতে পারে। 

এই ব্লগে, আমি মডেল/চ্যাটবট ফ্রেমওয়ার্কের একটি তালিকা প্রদান করেছি যা আপনাকে ChatGPT এবং GPT-4 এর মতো চ্যাটবট প্রশিক্ষণ ও তৈরি করতে সাহায্য করতে পারে। তাদের পছন্দ এবং তারকা দিতে ভুলবেন না. 

মন্তব্য বিভাগে আপনার আরও ভাল পরামর্শ থাকলে আমাকে জানান। আমি ভবিষ্যতে এটা যোগ করতে চাই.
 
 
আবিদ আলী আওয়ান (@1 আবিদালিয়াওয়ান) একজন প্রত্যয়িত ডেটা সায়েন্টিস্ট পেশাদার যিনি মেশিন লার্নিং মডেল তৈরি করতে পছন্দ করেন। বর্তমানে, তিনি মেশিন লার্নিং এবং ডেটা সায়েন্স টেকনোলজিতে বিষয়বস্তু তৈরি এবং প্রযুক্তিগত ব্লগ লেখার উপর মনোযোগ নিবদ্ধ করছেন। আবিদ টেকনোলজি ম্যানেজমেন্টে স্নাতকোত্তর ডিগ্রি এবং টেলিকমিউনিকেশন ইঞ্জিনিয়ারিংয়ে স্নাতক ডিগ্রি অর্জন করেছেন। তার দৃষ্টিভঙ্গি মানসিক অসুস্থতার সাথে সংগ্রামরত শিক্ষার্থীদের জন্য একটি গ্রাফ নিউরাল নেটওয়ার্ক ব্যবহার করে একটি AI পণ্য তৈরি করা।
 

সময় স্ট্যাম্প:

থেকে আরো কেডনুগেটস