March 2010 April 2010 May 2010 June 2010 July 2010
August 2010
September 2010 October 2010
November 2010
December 2010 January 2011 February 2011 March 2011 April 2011 May 2011 June 2011 July 2011 August 2011 September 2011 October 2011 November 2011 December 2011 January 2012 February 2012 March 2012 April 2012 May 2012 June 2012 July 2012 August 2012 September 2012 October 2012 November 2012 December 2012 January 2013 February 2013 March 2013 April 2013 May 2013 June 2013 July 2013 August 2013 September 2013 October 2013 November 2013 December 2013 January 2014 February 2014 March 2014 April 2014 May 2014 June 2014 July 2014 August 2014 September 2014 October 2014 November 2014 December 2014 January 2015 February 2015 March 2015 April 2015 May 2015 June 2015 July 2015 August 2015 September 2015 October 2015 November 2015 December 2015 January 2016 February 2016 March 2016 April 2016 May 2016 June 2016 July 2016 August 2016 September 2016 October 2016 November 2016 December 2016 January 2017 February 2017 March 2017 April 2017 May 2017 June 2017 July 2017 August 2017 September 2017 October 2017 November 2017 December 2017 January 2018 February 2018 March 2018 April 2018 May 2018 June 2018 July 2018 August 2018 September 2018 October 2018 November 2018 December 2018 January 2019 February 2019 March 2019 April 2019 May 2019 June 2019 July 2019 August 2019 September 2019 October 2019 November 2019 December 2019 January 2020 February 2020 March 2020 April 2020 May 2020 June 2020 July 2020 August 2020 September 2020 October 2020 November 2020 December 2020 January 2021 February 2021 March 2021 April 2021 May 2021 June 2021 July 2021 August 2021 September 2021 October 2021 November 2021 December 2021 January 2022 February 2022 March 2022 April 2022 May 2022 June 2022 July 2022 August 2022 September 2022 October 2022 November 2022 December 2022 January 2023 February 2023 March 2023 April 2023 May 2023 June 2023 July 2023 August 2023 September 2023 October 2023 November 2023 December 2023 January 2024 February 2024 March 2024 April 2024 May 2024 June 2024 July 2024 August 2024 September 2024 October 2024 November 2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
25
26
27
28
29
30
News Every Day |

This is the biggest question in AI right now

  • AI leaders are rethinking data-heavy training for large language models.
  • Traditional models scale linearly with data, but this approach may hit a dead end.
  • Smaller, more efficient models and new training methods are gaining industry support.

For years, tech companies like OpenAI, Meta, and Google have focused on amassing tons of data, assuming that more training material would lead to smarter, more powerful models.

Now, AI leaders are rethinking the conventional wisdom about how to train large language models.

The focus on training data arises from research showing that transformers, the neural networks behind large language models, have a one-to-one relationship with the amount of data they're given. Transformer models "scale quite linearly with the amount of data and compute they're given," Alex Voica, a consultant at the Mohamed bin Zayed University of Artificial Intelligence, previously told Business Insider.

However, executives are starting to worry that this approach can only go so far, and they're exploring alternatives for advancing the technology.

The money going into AI has largely hung on the idea that this scaling law "would hold," Scale AI CEO Alexandr Wang said at the Cerebral Valley conference this week, tech newsletter Command Line reported. It's now "the biggest question in the industry."

Some executives say the problem with the approach is that it's a little mindless. "It's definitely true that if you throw more compute at the model, if you make the model bigger, it'll get better," Aidan Gomez, the CEO of Cohere, said on the 20VC podcast. "It's kind of like it's the most trustworthy way to improve models. It's also the dumbest."

Gomez advocates smaller, more efficient models, which are gaining industry support for being cost-effective.

Others worry this approach won't reach artificial general intelligence — a theoretical form of AI that matches or surpasses human intelligence — even though many of the world's largest AI companies are banking on it.

Large language models are trained simply to "predict the next token, given the previous set of tokens," Richard Socher, a former Salesforce executive and CEO of AI-powered search engine You.com, told Business Insider. The more effective way to train them is to "force" these models to translate questions into computer code and generate an answer based on the output of that code, he said. This will reduce hallucinations in quantitative questions and enhance their abilities.

Not all industry leaders are sold that AI has hit a scaling wall, however.

"Despite what other people think, we're not at diminishing marginal returns on scale-up," Microsoft chief technology officer Kevin Scott said in July in an interview with Sequoia Capital's Training Data podcast.

Companies like OpenAI are also seeking to improve on existing LLMs.

OpenAI's o1, released in September, still relies on the token prediction mechanism Socher refers to. Still, the model is specialized to better handle quantitative questions, including areas like coding and mathematics — compared to ChatGPT, which is considered a more general-purpose model.

Part of the difference between o1 and ChatGPT is that o1 spends more time on inference or "thinking" before it answers a question.

"To summarize, if we were to anthropomorphize, gpt-4 is like your super know-it-all friend who when you ask them a question starts talking stream-of-consciousness, forcing you to sift through what they're saying for the gems," Waleed Kadous, a former engineer lead at Uber and former Google principal software engineer, wrote in a blog post. "o1 is more like the friend who listens carefully to what you have to say, scratches their chin for a few moments, and then shares a couple of sentences that hit the nail on the head."

One of o1's trade-offs, however, is that it requires much more computational power, making it slower and costlier, according to Artificial Analysis, an independent AI benchmarking website.

Read the original article on Business Insider
Игорь Маковский

«Смоленскэнерго» предупреждает об опасности поражения электрическим током после непогоды

African diplomats sat down at school desks

F1 Las Vegas Grand Prix – Start time, starting grid, how to watch, & more

Las Vegas GP F1 qualifying: George Russell takes pole, Lewis Hamilton only 10th

Michail Antonio reveals he was barred from entering the UK after passport blunder in nightmare international break

Ria.city






Read also

Don’t get caught in the 'Apple ID suspended' phishing scam

‘Robber’ beaten to death in Karachi’s Jauhar

Who was JonBenét detective Lou Smit, who died with the belief the Ramseys were innocent?

News, articles, comments, with a minute-by-minute update, now on Today24.pro

News Every Day

Michail Antonio reveals he was barred from entering the UK after passport blunder in nightmare international break

Today24.pro — latest news 24/7. You can add your news instantly now — here


News Every Day

Michail Antonio reveals he was barred from entering the UK after passport blunder in nightmare international break



Sports today


Новости тенниса
Елена Веснина

"Сменились приоритеты": Веснина пояснила причину ухода из тенниса



Спорт в России и мире
Москва

Анастасия Щипанова: модный символ закрытия Олимпиады в Париже



All sports news today





Sports in Russia today

Москва

9 район


Новости России

Game News

Rejoice, roguelike nerds: Shiren the Wanderer: The Mystery Dungeon of Serpentcoil Island is coming to Steam


Russian.city


Минск

Чем планирует заниматься в Минске польский юрист Томаш Шмидт


Губернаторы России
Игорь Маковский

Более 700 энергетиков продолжают устранять последствия непогоды в Смоленской области


Воронежский «Факел» отыгрался на последних секундах матча с московским «Динамо»

Десять проектов ГПМ Радио получили золотые микрофоны «Радиомании»

Психотерапевт Коэн перечислил главные признаки детской травмы

МИД РФ: Москва давно определилась с кандидатурой на пост посла в США


Пугачева плохо перепела хиты, Муравьева открестилась от былых дифирамбов. Кто задел Жанну Рождественскую

Люся Чеботина в Comedy Club предложила написать песню для Кристины Асмус про Гарика Харламова

Творческий вечер в Париже посвятили Булату Окуджаве

Хор Сретенского монастыря исполнил мурманчанам «Кукушку» Виктора Цоя


Чего ждать от Елены Рыбакиной с экс-тренером Новака Джоковича? Взгляд эксперта из России

Кубок Дэвиса. Финал. Берреттини играет с ван де Зандшульпом, Синнер встретится с Грикспором

Ольховский: Не думаю, что Синнер сможет добыть календарный «Большой шлем»

Оже-Альяссим о том, что Маррей будет тренировать Джоковича: «Значит, тур ATP – действительно фильм»



Прокуратура Москвы: 18-летний парень сдавал чужие квартиры под видом своих

9 район

Последние новости digital-сферы и финансов Казахстана

Вильфанд: снежный покров сохранится в столице и области до 1 декабря


Начальник Главного управления Росгвардии по Московской области полковник полиции Пётр Зоров обратился к ветеранам региональной общественной организации войск правопорядка

В Чехове сотрудники Росгвардии задержали подозреваемого в незаконном обороте наркотиков в крупном размере

Покер Угальде помог «Спартаку» разгромить «Локомотив» со счетом 5:2 в матче РПЛ

Путин телеграммой поздравил режиссера Кустурицу с 70-летним юбилеем


Центральная больница в Домодедове отметила 95-летие

Пассажир теплохода спрыгнул в Москву-реку на западе столицы и добрался до берега

«Ротор» победил «Нефтехимик» в матче Первой лиги

Татьяна Навка, Валерия, Григорий Лепс, Юлия Пересильд опубликовали фотографии со своими мамами по случаю Дня матери



Путин в России и мире






Персональные новости Russian.city
Александр Градский

Сын Александра Градского раскритиковал памятник на могиле отца



News Every Day

F1 Las Vegas Grand Prix – Start time, starting grid, how to watch, & more




Friends of Today24

Музыкальные новости

Персональные новости