Публикации по теме 'data-science'
Важные команды с пакетом Pandas
Импорт данных
pd.read_csv() pd.read _table() pd.read_excel() pd.real_sql() pd.read_json() pd.read_html() pd.DataFrame() pd.concat() pd.Серия() pd.date_range()
Очистка данных
df.dropna() df.fillna() df.sort_values() df.groupby() df.apply() df.append() df.join() дф.переименовать() df.set_index() df.to_csv()
Статистика данных
дф.голова() дф.высокий() df.info() df.desribe() df.mean() дф.медиана() df.std() df.count() дф.макс() дф.мин()
Программирование и математические основы ИИ и науки о данных
Любой учитель математики, особенно тот, кто разбирается в вычислительной технике, будет первым, кто расскажет о важности математики для компьютерных наук. Они не ошибаются. Все вычисления и вычисления — это просто расширение фундаментальных математических понятий с некоторыми уровнями абстракции. Точно так же, как знание математических концепций обогатит ваши знания в области программирования, особенно когда вы отважитесь на парадигму функционального программирования и лямбда-исчисление,..
Мой путь к точности
С чего начать? Наука о данных, если вы еще не знаете, настолько широка, насколько это вообще возможно, и мы только что начали курс. Он включает в себя несколько методологий и подходов для достижения желаемой модели, которая вращается вокруг данных. Не поймите меня неправильно, до этого курса программирование шло гладко, но высота этого холма уже заставила меня прыгнуть с корабля. Благодаря моим лекторам и их проведению курса у этого путешествия есть хороший конец.
Мероприятие..
Анонс CLIP-as-service: уровень бесплатного пользования
CLIP как услуга
Анонс CLIP-as-service: уровень бесплатного пользования
Реструктуризация CLIP-as-service и выпуск бесплатного уровня
В течение некоторого времени Jina AI размещала бесплатный экземпляр CLIP-as-service — готовую, масштабируемую и надежную реализацию CLIP, которая может генерировать встраивание текста и изображений, предоставлять подписи к изображениям и выполнять множество задач визуального мышления. До сих пор этот сервер был доступен напрямую через cURL или gRPC...
WordPiece: алгоритм токенизации на основе подслов
Понимание алгоритма токенизации на основе подслов, используемого в современных моделях НЛП - WordPiece
За последние несколько лет появилось много шума в области ИИ и особенно НЛП. 😎 Понимание и анализ человеческого языка - это не только сложная задача, но и увлекательная. Человеческий язык выглядит простым, но очень сложным, поскольку даже короткий текст может содержать ссылки как на личную жизнь, так и на внешний мир. 🧐 Эта сложность приносит много проблем. Исследователи во всем..
Если вы хотите узнать больше об этой теме на простом, но эффективном примере, я настоятельно…
Если вы хотите узнать больше об этой теме на простом, но эффективном примере, я настоятельно рекомендую вам проверить этот пост в блоге: Полное руководство для начинающих по веб-скрейпингу .
Устранение предвзятости ChatGPT
Создание LLM, которое не является расистским или сексистским
Большие языковые модели (LLM), такие как ChatGPT, являются расистскими, сексистскими, гомофобными и в целом наполнены всеми худшими предубеждениями общества, потому что они обучены на предвзятых данных. Как Браун и др. утверждают, что «модели, обученные в Интернете, имеют предубеждения в масштабе Интернета». В этом посте я рассмотрю конкретные примеры предвзятости в LLM, представлю несколько существующих методов для…