logo

Manieren om Pandas DataFrame te filteren op kolomwaarden

Het filteren van een Pandas DataFrame door middel van kolomwaarden is een veel voorkomende handeling tijdens het uitvoeren van informatie in Python. Om dit te bereiken kun je gebruik maken van verschillende methoden en technieken. Hier zijn talloze manieren om een ​​Pandas DataFrame uit te filteren via kolomwaarden.

In dit bericht zullen we verschillende manieren zien om Pandas Dataframe te filteren op kolomwaarden. Laten we eerst een dataframe maken:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Uitgang:

Dataframe

Rijen van Pandas Dataframe selecteren op basis van een bepaalde kolomwaarde met behulp van de operator ‘>’, ‘=’, ‘=’, ‘<=’, ‘!=’.

Voorbeeld 1: Het selecteren van alle rijen uit het gegeven dataframe waarin ‘Percentage’ groter is dan 75 [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Uitgang:

uitvoerdataframe

Voorbeeld 2: Het selecteren van alle rijen uit het gegeven dataframe waarin ‘Percentage’ groter is dan 70 plaats [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Uitgang:

uitvoer dataframe-1

Het selecteren van die rijen Pandas Dataframe waarvan de kolomwaarde aanwezig is in de lijst met behulp van Jij() methode van het dataframe.

Voorbeeld 1: Het selecteren van alle rijen uit het gegeven dataframe waarin ‘Stream’ aanwezig is in de optielijst met behulp van [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Uitgang:

uitvoer dataframe-2

Voorbeeld 2: Het selecteren van alle rijen uit het gegeven dataframe waarin ‘Stream’ aanwezig is in de optielijst met behulp van plaats [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Uitgang:

uitvoerdataframe-3

Rijen van Pandas Dataframe selecteren op basis van meerdere kolomvoorwaarden met behulp van de operator ‘&’.

Voorbeeld 1: Het selecteren van alle rijen uit het gegeven Dataframe waarin ‘Age’ gelijk is aan 22 en ‘Stream’ aanwezig is in de optielijst met behulp van [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Uitgang:

uitvoer dataframe-4

Voorbeeld 2: Het selecteren van alle rijen uit het gegeven Dataframe waarin ‘Age’ gelijk is aan 22 en ‘Stream’ aanwezig is in de optielijst met behulp van plaats [ ] .

Python3




Huffman-coderingscode

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Uitgang:

uitvoer dataframe-5