چینچیلا ای‌آی

از ویکی‌پدیا، دانشنامهٔ آزاد

چینچیلا ای‌آی (به انگلیسی: Chinchilla AI) یک خانواده از مدل‌های زبانی بزرگ است که توسط تیم تحقیقاتی دیپ‌مایند توسعه یافته و در مارس ۲۰۲۲ ارائه شده‌است.[۱] این مدل «چینچیلا» نامگذاری شده زیرا از خانواده مدل قبلی خود به نام «گوفر» پیشرفت بیشتری داشته‌است. هر دو مدل به منظور بررسی قوانین مقیاس‌بندی مدل‌های زبان بزرگ آموزش دیدند.[۲]

منابع[ویرایش]

  1. Hoffmann, Jordan; Borgeaud, Sebastian; Mensch, Arthur; Buchatskaya, Elena; Cai, Trevor; Rutherford, Eliza; Casas, Diego de Las; Hendricks, Lisa Anne; Welbl, Johannes; Clark, Aidan; Hennigan, Tom; Noland, Eric; Millican, Katie; Driessche, George van den; Damoc, Bogdan (2022-03-29). "Training Compute-Optimal Large Language Models". arXiv:2203.15556 [cs.CL].
  2. Rae, Jack W.; Borgeaud, Sebastian; Cai, Trevor; Millican, Katie; Hoffmann, Jordan; Song, Francis; Aslanides, John; Henderson, Sarah; Ring, Roman; Young, Susannah; Rutherford, Eliza; Hennigan, Tom; Menick, Jacob; Cassirer, Albin; Powell, Richard (2022-01-21). "Scaling Language Models: Methods, Analysis & Insights from Training Gopher". arXiv:2112.11446 [cs.CL].