[파이썬] 판다스(pandas) 팁37. clip() 함수로 임계(threshold) 수치 기준으로 수치 데이터 트리밍하기/다듬기


[파이썬] 판다스(pandas) 팁37. clip() 함수로 임계(threshold) 수치 기준으로 수치 데이터 트리밍하기/다듬기

파이썬 판다스 clip() 함수는 기본 데이터셋의 모든 수치에서 사용자가 지정한 입력 임계값을 기준으로 그것을 벗어나는 값들을 트리밍하는 데 사용된다. 이 함수를 사용하여 모든 셀이 데이터프레임에서 가질 수 있는 값에 하한과 상한을 설정할 수 있다.

개인적으로 활용할 수 있는 방법은 자신이 분석을 통하여 이상치라고 생각하는 기준을 임계값으로 설정하여 그 외에 해당하는 값들을 트리밍(trimming = 손질하다, 다듬다 등등)을 하는데 사용할 수 있다고 생각한다. 이상치라고 해서 전부 삭제할 수는 없는 노릇...

(이상치 다루기에 관한 포스팅은 상세 내용이 엄청 방대해서 아직도 완성하지 못했다...;ㅡ;...) clip() 함수를 사용..........

[파이썬] 판다스(pandas) 팁37. clip() 함수로 임계(threshold) 수치 기준으로 수치 데이터 트리밍하기/다듬기에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.



원문링크 : [파이썬] 판다스(pandas) 팁37. clip() 함수로 임계(threshold) 수치 기준으로 수치 데이터 트리밍하기/다듬기