2016년 10월 27일 목요일

extract data(paragraph, table) from docx file

회사에서 사용하는 워드문서(docx) 파일을 자동으로 분석할 필요가 생겨 알아 보았습니다.

아래 "1. 분석 대상 문서" 의 내용처럼 heading 이 되어 있는 내용들이 있고 그 안에 Text("Table 1") 나 table 이 있는 문서 입니다.

인터넷 검색을 하면 paragraph 를 얻거나 table 을 얻는 것을 각각 할 수는 있지만 둘을 다 할 수 있는 기능은 찾지 못하였는데 결국 둘다 한번에 얻을 수 있는 코드를 찾아서 실행하니 원하는 결과를 얻을 수 있었습니다.

몇달간 조금씩 고민했던 내용이라 실행이 되어서 기쁘지만 이것보다 좋은 방법이 있는지 궁금 하네요.

혹시 더 좋은 방법을 아시면 소개 부탁 드립니다.



참조 Link

댓글 없음:

댓글 쓰기