2016년 10월 29일 토요일
2016년 10월 27일 목요일
extract data(paragraph, table) from docx file
회사에서 사용하는 워드문서(docx) 파일을 자동으로 분석할 필요가 생겨 알아 보았습니다.
아래 "1. 분석 대상 문서" 의 내용처럼 heading 이 되어 있는 내용들이 있고 그 안에 Text("Table 1") 나 table 이 있는 문서 입니다.
인터넷 검색을 하면 paragraph 를 얻거나 table 을 얻는 것을 각각 할 수는 있지만 둘을 다 할 수 있는 기능은 찾지 못하였는데 결국 둘다 한번에 얻을 수 있는 코드를 찾아서 실행하니 원하는 결과를 얻을 수 있었습니다.
몇달간 조금씩 고민했던 내용이라 실행이 되어서 기쁘지만 이것보다 좋은 방법이 있는지 궁금 하네요.
혹시 더 좋은 방법을 아시면 소개 부탁 드립니다.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
import os | |
import docx | |
from docx.document import Document | |
from docx.oxml.table import CT_Tbl | |
from docx.oxml.text.paragraph import CT_P | |
from docx.table import _Cell, Table | |
from docx.text.paragraph import Paragraph | |
os.chdir('C:\\OJT_Kevin\\161027_docx_parsing') | |
def iter_block_items(parent): | |
""" | |
Yield each paragraph and table child within *parent*, in document order. | |
Each returned value is an instance of either Table or Paragraph. *parent* | |
would most commonly be a reference to a main Document object, but | |
also works for a _Cell object, which itself can contain paragraphs and tables. | |
""" | |
if isinstance(parent, Document): | |
parent_elm = parent.element.body | |
elif isinstance(parent, _Cell): | |
parent_elm = parent._tc | |
else: | |
raise ValueError("something's not right") | |
for child in parent_elm.iterchildren(): | |
if isinstance(child, CT_P): | |
yield Paragraph(child, parent) | |
elif isinstance(child, CT_Tbl): | |
yield Table(child, parent) | |
doc = docx.Document('sample.docx') | |
for block in iter_block_items(doc): | |
if "Paragraph" in str(type(block)): | |
print (block.text) | |
elif "Table" in str(type(block)): | |
for row in block.rows: | |
for cell in row.cells: | |
for paragraph in cell.paragraphs: | |
print (paragraph.text) |
2016년 10월 9일 일요일
Catch Game with Scratch language
Analysis for the Catch Game with Scratch language
See game: Link
1. Apple, Bowl(Sprite1)
2. Apple does 2 works, Bowl does 1 work.
3. Apple does
3.1 Moving from the Up to Down
3.2 If apple is touched by bowl, move to Top again and add Score 1
4. Bowl does
4.1 Moving to left and right
Game Screen and Codes
피드 구독하기:
글 (Atom)