python으로 hdfs 접근
python으로 hdfs에 이미지, 영상 데이터를 적재해야 할 일이 생겨 작성하게 되었다.
필요 라이브러리
hdfs 라이브러리가 필요하다.
$ pip3 install hdfs
코드
from hdfs import Client, HdfsError
hdfs_client = Client(f'http://{ip주소}:{port}', proxy='{user}')
load_path = '/user/hive/warehouse/test'
image_path = '/DATA/temp/test.mp4'
hdfs_client.makedirs(load_path)
hdfs_client.upload(load_path, image_path, overwrite=True)
디렉토리 만들고 이미지 파일을 업로드하는 코드이다.
추가적인 정보는 python HDFSCLI 공식 문서 를 참고하자.
Leave a comment