Python pandas تصفية nan من تحديد بيانات عمود من السلاسل


Answers

أبسط من جميع الحلول:

filtered_df = df[df['name'].notnull()]

وبالتالي ، فإنه يرشح فقط الصفوف التي لا تحتوي على قيم NaN في عمود "الاسم".

Question

دون استخدام groupby كيف يمكنني تصفية البيانات دون NaN ؟

لنفترض أن لدي مصفوفة حيث سيملأ العملاء "N / A" أو "n / a" أو أي من أشكالها والبعض الآخر يتركها فارغة:

import pandas as pd
import numpy as np


df = pd.DataFrame({'movie': ['thg', 'thg', 'mol', 'mol', 'lob', 'lob'],
                  'rating': [3., 4., 5., np.nan, np.nan, np.nan],
                  'name': ['John', np.nan, 'N/A', 'Graham', np.nan, np.nan]})

nbs = df['name'].str.extract('^(N/A|NA|na|n/a)')
nms=df[(df['name'] != nbs) ]

انتاج:

>>> nms
  movie    name  rating
0   thg    John       3
1   thg     NaN       4
3   mol  Graham     NaN
4   lob     NaN     NaN
5   lob     NaN     NaN

كيف يمكنني تصفية قيم NaN حتى أتمكن من الحصول على نتائج للعمل مع مثل هذا:

  movie    name  rating
0   thg    John       3
3   mol  Graham     NaN

أنا أظن أنني بحاجة إلى شيء مثل ~np.isnan ولكن لا تعمل تيلدا مع السلاسل.






Links