<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, на системах с одним GPU</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html</link>
    <description>Группа исследователей из Стендфордского университета, Калифорнийского университета в Беркли, Швейцарской высшей технической школы Цюриха, Высшей школы экономики, университета Карнеги &amp;#8212; Меллона, а также компаний Yandex и Meta, опубликовала исходные тексты движка для выполнения крупных языковых моделей на системах с ограниченными ресурсами. Например, движок предоставляет возможность создания функциональности, напоминающей  ChatGPT и Copilot, через выполнение готовой натренированной модели OPT-175B, охватывающей 175 миллиардов параметров,  на обычном компьютере с игровой видеокартой NVIDIA RTX3090, оснащённой 24GB видеопамяти. Код написан на языке Python, использует фреймворк PyTorch и распространяется под лицензией Apache 2.0...&lt;br&gt;&lt;br&gt;Подробнее: https://www.opennet.ru/opennews/art.shtml?num=58681&lt;br&gt;</description>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (crash2)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#84</link>
    <pubDate>Sun, 26 Feb 2023 11:57:37 GMT</pubDate>
    <description>out of memory)&lt;br&gt;</description>
</item>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (X86)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#83</link>
    <pubDate>Sat, 25 Feb 2023 18:16:51 GMT</pubDate>
    <description>Нифига себе оздоровление. &lt;br&gt;</description>
</item>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (Answer)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#82</link>
    <pubDate>Fri, 24 Feb 2023 17:30:56 GMT</pubDate>
    <description>Вы наверное пост не читали и по ссылкам не ходили&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#80</link>
    <pubDate>Thu, 23 Feb 2023 09:52:55 GMT</pubDate>
    <description>Вообще даже близко нет. Погугли на youtube харвестеры которые лес валят и сам прикинь сколько они заменяют рабочих. Или машины для сбора плодов и ягод посмотри.&lt;br&gt;</description>
</item>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#79</link>
    <pubDate>Thu, 23 Feb 2023 08:36:25 GMT</pubDate>
    <description>&amp;gt; При выполнении модели OPT-175B на системе с одним GPU NVIDIA T4 (16ГБ)&lt;br&gt;&lt;br&gt;Это полный бред. Для 175B требуется минимум 350GB VRAM. Даже если делать CPU offloading, то всё равно нужно будет около 500GB обычной RAM и инференция будет со скоростью 1 токен в день. Даже в README на GitHub написано:&lt;br&gt;&lt;br&gt;&amp;gt; Chat with OPT-6.7B. You need at least 15GB of GPU memory&lt;br&gt;&lt;br&gt;Т.е. 15GB VRAM - это чисто на 6.7B. Ни о каких 175B тут даже и думать не стоит. Для примера: я на своей RTX3060 12GB еле-еле со скрипом могу запустить 13B модели со скоростью 1 токен в 1.5 секунды, да и то я там применяю всякие трюки типа INT8 precision, чтобы снизить потребление VRAM.&lt;br&gt;</description>
</item>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#77</link>
    <pubDate>Wed, 22 Feb 2023 19:31:45 GMT</pubDate>
    <description>&amp;gt; Запомните этот твит: лишившиеся работы подадут коллективный иск к &quot;чудо-прорывателям полезных &lt;br&gt;&amp;gt; технологий&quot;.&lt;br&gt;&lt;br&gt;Гдк-то я это уже видел. Кажется, тут! https://ru.wikipedia.org/wiki/&#037;D0&#037;9B&#037;D1&#037;83&#037;D0&#037;B4&#037;D0&#037;B4&#037;D0&#037;B8&#037;D1&#037;82 - а вот подача заявления в суд, сразу с приговором - https://ru.wikipedia.org/wiki/&#037;D0&#037;A4&#037;D0&#037;B0&#037;D0&#037;B9&#037;D0&#037;BB:FrameBreaking-1812.jpg&lt;br&gt;&lt;br&gt;И как - сильно им это помогло?&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#76</link>
    <pubDate>Wed, 22 Feb 2023 16:40:57 GMT</pubDate>
    <description>Кажется графику полностью отдадут AMD... Ну ок. &lt;br&gt;</description>
</item>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (YM2608)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#74</link>
    <pubDate>Wed, 22 Feb 2023 15:05:05 GMT</pubDate>
    <description>кто нибудь скачал - сколько оно весит и сколько времени оно компилится?&lt;br&gt;</description>
</item>

<item>
    <title>FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, н... (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/129822.html#73</link>
    <pubDate>Wed, 22 Feb 2023 14:56:21 GMT</pubDate>
    <description>3090 это уже давно мастхев для любого десктопа.  &lt;br&gt;</description>
</item>

</channel>
</rss>
