Вопросы с тегом 'data-science'

Количество результатов: 498

0 голосов
0 ответов
Статистически дифференцируемые показания датчика температуры и динамическое заданное значение температуры + исторические данные

Сейчас я работаю над проектом, где я хотел бы статистически дифференцировать датчики температуры показания, от показаний температуры заданного значения в пределах движ...

-1 голос
1 ответ
Как создать почтовую папку для многократного вывода в питоне

я пытаюсь построить .Its приложение работает нормально, для создания CSV и PDF-файл .Теперь я хочу, чтобы создать файл почтового индекса, который будет содержать как P...

0 голосов
1 ответ
Чтение Rds файла с мерзавцем

Я пытаюсь прочитать файл Rds, непосредственно с GitHub. Я могу прочитать любой файл из мерзавца, но когда я пытаюсь читать Rds файл, используя gzcon его просит значени...

0 голосов
0 ответов
Drake: Как исправить IOException?

Я хотел проверить селезень, Инструмент для организации командных расстрелов. Мой Drakefile выглядит следующим образом: top-5 <- ...

0 голосов
1 ответ
Загрузка несколько dataframes из одного CSV с помощью панды или NumPy

У меня есть один CSV-файл с несколькими симуляторами разграничены записями Simulation (Index). Каждая запись имеет временную линию и 3 характерных линий. В основном пе...

0 голосов
0 ответов
Выбор строк, которые выполняют недостающее количество атрибутов таблицы?

Предположим, у меня есть список атрибутов представлен в виде каждого столбца таблицы имея таблицу продуктов, как показано ниже, Все атрибуты, имеющие одинаковые едини...

0 голосов
1 ответ
Python Панда Связь между расстоянием и Weekday колонной

У меня есть набор данных, который имеет расстояние и будний столбец. Расстояние двойное значение, будний строка. (Понедельник, вторник...) Как я показываю соотношение...

0 голосов
0 ответов
Anomaly Detection в данных временных рядов последовательных

Я новичок в науке данных, и я только начинаю свой личный проект. Целью является обнаружение аномалий в ИТ-системах, использующих системные журналы. Бревна время наборы...

2 голоса
1 ответ
заливка Панды из последней строки, отвечающие определенным критериям?

У меня есть панд dataframe который имеет разделы, глядя, как это (нули Нэн): ... 18 19 20 197 14 28 14 198 14 0 14 200 0 0 0 201 0 0 0 202 ...

0 голосов
0 ответов
Как прочитать файл TSV в MRJob, когда некоторые записи имеют «\ N» внутри?

Я пытаюсь прочитать файл TSV в картографа MRJob. class MRJobJoin(MRJob): def mapper(self,_,line): data = line.split("\t") if len(data) == 5: # making sure w...

0 голосов
0 ответов
Увеличение размера матрицы в Python

Я работаю над увеличением размерности матрицы т.е. добавление 0-я колонна из 1-х. Я изменил матрицу 3 * 3 и добавил столбец 1 на 1-е колонка. Теперь, когда я многократ...

0 голосов
0 ответов
Алгоритм для прогнозирования числового значения номинальных значений

Я новичок в науке данных Сейчас я работаю в случае студентов баллов. Таковы особенности набора данных 1- Gender 2- IQLevel 3- WritingScore 4- MathScore Образец...

0 голосов
1 ответ
Необходимость Бонферони коррекции в тестировании A/B?

Я новичок в области науки данных. Я наткнулся ниже утверждений, которые читают: 1) More metrics we choose in our A/B testing, higher the chance of getting significant...

1 голос
0 ответов
гири класса атрибутов в keras для класса балансировки

Имея в виду, что у есть один горячий кодированный import numpy as np from sklearn.utils.class_weight import compute_class_weight y_integers = np.argmax(y, axis=1) cl...

0 голосов
0 ответов
Большие журналы в формате JSON - обработка данных и анализ

Я новичок здесь и я прошу вашего понимания. Я новичок в области обработки и анализа данных. Я хотел бы обратиться за помощью в моей задаче. У меня есть три набора дан...

0 голосов
1 ответ
Является ли это переобучение

Я бегу алгоритм машинного обучения, чтобы ответить на True/False вопросы. Предполагая, что я использую классификацию Algo. После запуска 1200 данных, я получил 30% точ...

0 голосов
1 ответ
В поисках набора данных для богатства и управления активами

В поисках набора данных для актива и/или управления капиталом для запуска некоторых машинного обучения алгоритмов на ней любые идеи, где я могу получить его, пытались ...

1 голос
0 ответов
Как определить, какие вероятности распределения для использования на проблемы конкретного?

Какая вероятность распределения я могу использовать, чтобы понять, количество заказов, один человек может работать в компании? Это как у каждого человека есть заказы, ...

1 голос
1 ответ
Диаграмма/Графические опции для отображения декартово произведение в можжевельника Notebook/Python/Matplotlib?

Я буду работать с 49 вариантами (7 рядов, 7 столбцов). Вот пример Я наблюдая, что люди (позиция й действий) в общественных площадях (всего четыре) для школьного прое...

0 голосов
0 ответов
модель обучения Apache PredictionIO по нарастающей

Я планирую использовать PredictionIO Apache с шаблоном Универсального Рекомендатора ActionML в. Я неприятности выяснить, как тренировать модель пошагово, т.е. я тренир...

0 голосов
0 ответов
Как исследовать набор данных, используя функцию в Python для поиска выгодных приложений?

Я делаю упражнения из Dataquest. Я получаю странные результаты, как, «переменная Android данных дают результат как„Нет“, и есть слишком много строк, а также, что не пе...

0 голосов
0 ответов
Составление графиков с миллионами значений в браузере

Я должен загрузить миллионы значений (строки и поплавки) в браузере, для рисования графиков. Проблема заключается в том, что 500k достаточно для иметь задержку на загр...

0 голосов
1 ответ
сети затрат Расчет Numpy нейронные: результат меняется после первого запуска

В python3.7, у меня возникли проблемы с моим расчетом нейронной сети затрат.Когда я первый запустить compute_cost_nn Я получаю правильную цену 0.28762916516131887 но и...

1 голос
0 ответов
вычисление длительности события в панде

Я пытаюсь ссылаться на этот SO сообщение где первый ответ кто-то создает код для анализа данных временных рядов падения дождя и Totalize в часах для каждого события до...

0 голосов
1 ответ
Как найти уравнение из модели линейной регрессии

У меня есть набор данных, и я бегу линейную модель. lm_4 = sm.OLS(y_train,X_train).fit() print(lm_4.summary()) Параметры, скажем, как показано ниже: print(lm_4.par...

1 голос
1 ответ
Предсказание маслобойки заказчика с помощью машинного обучения с запаздыванием

У меня есть данные 5000 клиентов в течение временного ряда (ежемесячно), который выглядит как: Это мой первый раз дело с данными временных рядов. Может кто-нибудь о...

-1 голос
1 ответ
Вычитание каждого столбца dataframe друг с другом эффективно?

например, у меня есть кадр данных показан ниже, и я хотел бы, чтобы создать новый dataframe, который имеет столбцы вычитания предыдущих. Dataframe Дано: (может иметь ...

0 голосов
1 ответ
продолжительность высчитывает событий панды

Я пытаюсь следовать этот первый ответ это SO сообщение для вычисления продолжительности событий. Пример в посте осадков продолжительности и человек хочет знать тотализ...

1 голос
2 ответа
Недостатки железно-тест раскола

"«Поезд/раздельное испытание имеет свои опасности, - что, если разделение мы делаем не случайно, что, если один подмножество наших данных имеют только человек из опред...

0 голосов
0 ответов
Как использовать внешнюю функцию панды GroupBy()?

Фон Таким образом, у меня есть ансамбль модель, основанную, и я хочу, чтобы после процесса метки, которые я получил от N-детекторов. Для этого я хочу, чтобы использов...

0 голосов
0 ответов
Конфигурация расположения файла главного узла PySpark

Это мои свойства конфигурации искры. Мой главный узел в операционной системе Linux. spark = SparkSession.builder \ .master("spark://ip:7077") \ .appName("usres mobil...

0 голосов
3 ответа
что лучшая машина алгоритм обучения в моей ситуации

Предположим, что турист не имеет ни малейшего представления о городе, чтобы посетить, я хочу порекомендовать топ-10 городов на основе его отличительных особенностей го...

0 голосов
0 ответов
как создать CNN-BILSTM для временных рядов прогнозирования?

Ниже код работает отлично, но мне интересно, как я могу создать CNN-BILSTM модель из-за этого. Общая цель заключается в повышении точности модели. Кроме того, учитывая...

2 голоса
1 ответ
Эквивалентный код Python для mutate_if из tidyverse

Я заядлый пользователь R и учусь питон по пути. Одним из примеров кода, который можно легко запустить в R озадачивает меня в Python. Вот исходные данные (построен в R...

1 голос
0 ответов
Неточный фазовый портрет результат с Matplotlib

Я пытаюсь построить фазовый портрет для уравнения, как это определено в моей функции SH2 в коде ниже. Я знаю, что ожидаемый фазовый участок должен быть [[ожидается фаз...

0 голосов
1 ответ
Каков наилучший метод для отображения функции косинуса с большим набором данных в Python?

У меня есть большой набор данных (~ 17000 значений), состоящие из массива объектов даты и времени, а другой массива связанных значений с плавающей точкой. Я пытаюсь от...

0 голосов
1 ответ
AttributeError: «поплавок» объект не имеет атрибута «раскола» в панде

Я хочу, чтобы подсчитать количество тегов в строке, но в то время как цикл по каждой строке я получаю сообщение об ошибке атрибута, даже если мой тип данных для столбц...

2 голоса
1 ответ
PyTorch Huggingface БЕРТ-NLP для Named распознавания объектов

Я использую реализацию PyTorch от компании Google БЕРТ по HuggingFace для MADE 1.0 набора данных в течение довольно продолжительного времени. До последнего времени (11...

0 голосов
0 ответов
SKLearn/табличные данные: Как обрабатывать элементы фрейма данных, которые содержат другие списки, чем один горячий кодирования?

Резюме: Я пытаюсь предсказать категориальные аспекты судебного дела (например, результаты) с использованием sklearn-х RandomForestClassifier на множестве данных Thats ...

2 голоса
1 ответ
Numpy Python R eqivalent индексации

import numpy as np o = np.array([ [ [1,2,3,4], [5,6,7,8] ], [ [9,10,11,12], ...

0 голосов
0 ответов
Как TF-IDF использоваться для обнаружения источника программирования кода плагиат?

я кратко понять, как работает TF-IDF, для обнаружения плагиата в статьях, это имеет смысл. Теперь мне сказали, чтобы использовать его против программирования исходног...

0 голосов
0 ответов
Почему ДПМ лучше, чем ПДС в науке данных?

Почему наказываться Несхожесть Measure (ДАЯ) лучше, чем частичная стратегия Distance (ПДС) в науке данных?

0 голосов
0 ответов
Ошибка в коде при вычислении предсказанных вероятностей от порядковой логистической регрессии

Пытаясь вычислить предсказанные вероятности из порядковой логистической регрессии. Тем не менее, я получаю следующее сообщение об ошибке: Ошибка в rep.int (rep.int...

0 голосов
3 ответа
Выберите первую строку каждой группы после того, как «GroupBy()» и «value_counts() функцию

У меня есть набор данных с именем new_data_set который выглядит следующим образом: Образ Я хочу, чтобы найти жанр, который пришел максимальное количество раз в течен...

1 голос
1 ответ
который CNN архитектура хороша для обнаружения болезни растений листьев?

Я работаю по выявлению заболеваний растений с использованием отпуском изображения растений. Я буду использовать алгоритм CNN для выполнения этой задачи. Моя среда Wind...

0 голосов
1 ответ
Как добавить значения при диагонали массива dataframe в большой основанном на именах строк/столбцов?

Я хочу построить корреляционную матрицу всех авторов серии статей. Во-первых, я построю матрицу корреляции всех авторов ко всем авторам инициализируются нулями и пред...

1 голос
1 ответ
Учитывая список имен файлов изображений для eachset, Сплит большого набора данных для обучения/уважительных/тестовых каталогов?

Я пытаюсь разделить большой набор данных в поезд/действительный/тестовые наборы из Food101 набор данных для классификации изображений и структура набора данных, как ...

0 голосов
0 ответов
Пол R пакет Добавить уникальный идентификатор, который входит в набор данных

Я не в состоянии добавить уникальный идентификатор, который является частью набора данных. Набор включает в себя first_name, Email (Уникальный идентификатор), и DBO. К...

1 голос
1 ответ
Поиск оптимального решения многофакторной функции с пренебрежимо малым временем решения?

Так что у меня этот вопрос, где я должен найти наилучшее распределение, что при прохождении через функцию, соответствует известной поверхности. Я написал сценарий, кот...

0 голосов
1 ответ
Панды Проверьте последовательность или шаблон

Мне нужно, чтобы проверить, есть ли специальный шаблон в колоннах, это легче увидеть с некоторыми данными. теперь, если вы видите, есть пробивать в в рядом друг с д...

1 2 3 4 5 6 7 8 9 10 right