March 2010 April 2010 May 2010 June 2010 July 2010
August 2010
September 2010 October 2010
November 2010
December 2010 January 2011 February 2011 March 2011 April 2011 May 2011 June 2011 July 2011 August 2011 September 2011 October 2011 November 2011 December 2011 January 2012 February 2012 March 2012 April 2012 May 2012 June 2012 July 2012 August 2012 September 2012 October 2012 November 2012 December 2012 January 2013 February 2013 March 2013 April 2013 May 2013 June 2013 July 2013 August 2013 September 2013 October 2013 November 2013 December 2013 January 2014 February 2014 March 2014 April 2014 May 2014 June 2014 July 2014 August 2014 September 2014 October 2014 November 2014 December 2014 January 2015 February 2015 March 2015 April 2015 May 2015 June 2015 July 2015 August 2015 September 2015 October 2015 November 2015 December 2015 January 2016 February 2016 March 2016 April 2016 May 2016 June 2016 July 2016 August 2016 September 2016 October 2016 November 2016 December 2016 January 2017 February 2017 March 2017 April 2017 May 2017 June 2017 July 2017 August 2017 September 2017 October 2017 November 2017 December 2017 January 2018 February 2018 March 2018 April 2018 May 2018 June 2018 July 2018 August 2018 September 2018 October 2018 November 2018 December 2018 January 2019 February 2019 March 2019 April 2019 May 2019 June 2019 July 2019 August 2019 September 2019 October 2019 November 2019 December 2019 January 2020 February 2020 March 2020 April 2020 May 2020 June 2020 July 2020 August 2020 September 2020 October 2020 November 2020 December 2020 January 2021 February 2021 March 2021 April 2021 May 2021 June 2021 July 2021 August 2021 September 2021 October 2021 November 2021 December 2021 January 2022 February 2022 March 2022 April 2022 May 2022 June 2022 July 2022 August 2022 September 2022 October 2022 November 2022 December 2022 January 2023 February 2023 March 2023 April 2023 May 2023 June 2023 July 2023 August 2023 September 2023 October 2023 November 2023 December 2023 January 2024 February 2024 March 2024 April 2024 May 2024 June 2024 July 2024 August 2024 September 2024 October 2024 November 2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
26
27
28
29
30
News Every Day |

AI leaders are starting to rethink the best way to advance AI

  • AI leaders are rethinking data-heavy training for large language models.
  • Traditional models scale linearly with data, but this approach may hit a dead end.
  • Smaller, more efficient models and new training methods are gaining industry support.

For years, tech companies like OpenAI, Meta, and Google have focused on amassing tons of data, assuming that more training material would lead to smarter, more powerful models.

Now, AI leaders are rethinking the conventional wisdom about how to train large language models.

The focus on training data arises from research showing that transformers, the neural networks behind large language models, have a one-to-one relationship with the amount of data they're given. Transformer models "scale quite linearly with the amount of data and compute they're given," Alex Voica, a consultant at the Mohamed bin Zayed University of Artificial Intelligence, previously told Business Insider.

However, executives are starting to worry that this approach can only go so far, and they're exploring alternatives for advancing the technology.

The money going into AI has largely hung on the idea that this scaling law "would hold," Scale AI CEO Alexandr Wang said at the Cerebral Valley conference this week, tech newsletter Command Line reported. It's now "the biggest question in the industry."

Some executives say the problem with the approach is that it's a little mindless. "It's definitely true that if you throw more compute at the model, if you make the model bigger, it'll get better," Aidan Gomez, the CEO of Cohere, said on the 20VC podcast. "It's kind of like it's the most trustworthy way to improve models. It's also the dumbest."

Gomez advocates smaller, more efficient models, which are gaining industry support for being cost-effective.

Others worry this approach won't reach artificial general intelligence — a theoretical form of AI that matches or surpasses human intelligence — even though many of the world's largest AI companies are banking on it.

Large language models are trained simply to "predict the next token, given the previous set of tokens," Richard Socher, a former Salesforce executive and CEO of AI-powered search engine You.com, told Business Insider. The more effective way to train them is to "force" these models to translate questions into computer code and generate an answer based on the output of that code, he said. This will reduce hallucinations in quantitative questions and enhance their abilities.

Not all industry leaders are sold that AI has hit a scaling wall, however.

"Despite what other people think, we're not at diminishing marginal returns on scale-up," Microsoft chief technology officer Kevin Scott said in July in an interview with Sequoia Capital's Training Data podcast.

Companies like OpenAI are also seeking to improve on existing LLMs.

OpenAI's o1, released in September, still relies on the token prediction mechanism Socher refers to. Still, the model is specialized to better handle quantitative questions, including areas like coding and mathematics — compared to ChatGPT, which is considered a more general-purpose model.

Part of the difference between o1 and ChatGPT is that o1 spends more time on inference or "thinking" before it answers a question.

"To summarize, if we were to anthropomorphize, gpt-4 is like your super know-it-all friend who when you ask them a question starts talking stream-of-consciousness, forcing you to sift through what they're saying for the gems," Waleed Kadous, a former engineer lead at Uber and former Google principal software engineer, wrote in a blog post. "o1 is more like the friend who listens carefully to what you have to say, scratches their chin for a few moments, and then shares a couple of sentences that hit the nail on the head."

One of o1's trade-offs, however, is that it requires much more computational power, making it slower and costlier, according to Artificial Analysis, an independent AI benchmarking website.

Read the original article on Business Insider
Игорь Бутман

«Крейсер, подлодка и воздушный шар»: Бутман о необычных местах, где играл джаз

Michail Antonio reveals he was barred from entering the UK after passport blunder in nightmare international break

Sky Sports commentator stunned by ‘one of the strangest reactions to a goal I’ve ever seen’ by Watford fans

Las Vegas GP F1 qualifying: George Russell takes pole, Lewis Hamilton only 10th

F1 Las Vegas Grand Prix – Start time, starting grid, how to watch, & more

Ria.city






Read also

I’m a Celeb fans spot show ‘feud’ and insist host Ant McPartlin ‘hates’ campmate

Horse racing tips: Bash the bookies with these three longshots at Ludlow

The Traitors’ Charlotte Chilton slams winner Harry Clark for ‘ghosting her’ amid pregnancy with his pal Conor Maynard

News, articles, comments, with a minute-by-minute update, now on Today24.pro

News Every Day

F1 Las Vegas Grand Prix – Start time, starting grid, how to watch, & more

Today24.pro — latest news 24/7. You can add your news instantly now — here


News Every Day

F1 Las Vegas Grand Prix – Start time, starting grid, how to watch, & more



Sports today


Новости тенниса
Кубок Дэвиса

Теннисисты из Италии второй раз подряд выиграли Кубок Дэвиса



Спорт в России и мире
Москва

Дарья Семянова — теннисистка и модель, начала вести свой блог



All sports news today





Sports in Russia today

Москва

9 район


Новости России

Game News

Rejoice, roguelike nerds: Shiren the Wanderer: The Mystery Dungeon of Serpentcoil Island is coming to Steam


Russian.city


Москва

"Зенит" обыграл "Динамо" в Москве: счет 3-1 в пользу гостей


Губернаторы России
Guf

Рэпер Guf анонсировал прощальный тур в 2025 году


Московский планетарий раскрыл длительность самого короткого светового дня в 2024 году

«Микробиотики микст» с антоцианами удостоены золотой медали на Международном Конкурсе качества

Писатель Виктор Николаев поделился с челябинцами своими мыслями о ценностях жизни

Дерматовенеролог рассказала, что означают красные родинки


РПЦ: патриарх Кирилл простил певца Шарлота и попросил снять с него обвинения

В музее «Искусство Омска» открылись выставки о «суперсибиряке» Егоре Летове

Лекцию о творчестве Высоцкого и Окуджавы провели в Химках

Смесь Моцарта с японским художником: в Музее ИЗО открылась выставка Елены Ермолиной


«Немного недотягиваю до Соболенко». 19-летняя россиянка сравнила себя с теннисистками WTA

Кубок Дэвиса — 2024: церемония прощания Рафаэля Надаля с теннисом вызвала критику, почему не приехал Новак Джокович

Веснина о разгромной победе на парном «Уимблдоне»-2017: «Федерер спросил: «А вы меня научите так финалы выигрывать?»

Елена Веснина: «Путь длиною в 30 лет пройден. Теннис – лучшая игра на свете, но пришло время двигаться дальше»



"Зенит" обыграл "Динамо" в Москве: счет 3-1 в пользу гостей

Эмир Кустурица заявил, что приедет в Москву снимать фильм по Достоевскому

9 район

Подкаст "Женское дело. Лаборатория успеха". В гостях Евгения Гурова


Ради любви готовы на спорт

Более 700 энергетиков продолжают устранять последствия непогоды в Смоленской области

Кабинет Артиста в Яндекс. Кабинет Артиста в Яндекс Музыке.

Бастрыкин поручил возбудить дело после видео с избиением школьницы в Иркутске


У жителя посёлка Пустоши полицией Подмосковья изъято более 26 кг сухой конопли и 7 кг марихуаны

Ведущая «Спокойной ночи, малыши!» Татьяна Судец: Хороших детских программ на ТВ сегодня нет

Барко: «Сложно представить, что в России поиграю ещё где-то»

"Нити" - художественный фильм 1984 года про ядерную войну



Путин в России и мире






Персональные новости Russian.city
Сергей Шнуров

Суд в Москве отказал Шнурову в деле о взыскании 90 млн за сорванные концерты



News Every Day

F1 Las Vegas Grand Prix – Start time, starting grid, how to watch, & more




Friends of Today24

Музыкальные новости

Персональные новости