2016년 10월 29일 토요일

python library가 설치되는 곳

(C:\Users\user1\Anaconda2\)Lib\site-packages 이해되는 것은 추가 코멘트

2016년 10월 27일 목요일

extract data(paragraph, table) from docx file

회사에서 사용하는 워드문서(docx) 파일을 자동으로 분석할 필요가 생겨 알아 보았습니다.

아래 "1. 분석 대상 문서" 의 내용처럼 heading 이 되어 있는 내용들이 있고 그 안에 Text("Table 1") 나 table 이 있는 문서 입니다.

인터넷 검색을 하면 paragraph 를 얻거나 table 을 얻는 것을 각각 할 수는 있지만 둘을 다 할 수 있는 기능은 찾지 못하였는데 결국 둘다 한번에 얻을 수 있는 코드를 찾아서 실행하니 원하는 결과를 얻을 수 있었습니다.

몇달간 조금씩 고민했던 내용이라 실행이 되어서 기쁘지만 이것보다 좋은 방법이 있는지 궁금 하네요.

혹시 더 좋은 방법을 아시면 소개 부탁 드립니다.



import os
import docx
from docx.document import Document
from docx.oxml.table import CT_Tbl
from docx.oxml.text.paragraph import CT_P
from docx.table import _Cell, Table
from docx.text.paragraph import Paragraph
os.chdir('C:\\OJT_Kevin\\161027_docx_parsing')
def iter_block_items(parent):
"""
Yield each paragraph and table child within *parent*, in document order.
Each returned value is an instance of either Table or Paragraph. *parent*
would most commonly be a reference to a main Document object, but
also works for a _Cell object, which itself can contain paragraphs and tables.
"""
if isinstance(parent, Document):
parent_elm = parent.element.body
elif isinstance(parent, _Cell):
parent_elm = parent._tc
else:
raise ValueError("something's not right")
for child in parent_elm.iterchildren():
if isinstance(child, CT_P):
yield Paragraph(child, parent)
elif isinstance(child, CT_Tbl):
yield Table(child, parent)
doc = docx.Document('sample.docx')
for block in iter_block_items(doc):
if "Paragraph" in str(type(block)):
print (block.text)
elif "Table" in str(type(block)):
for row in block.rows:
for cell in row.cells:
for paragraph in cell.paragraphs:
print (paragraph.text)
참조 Link

2016년 10월 9일 일요일

Catch Game with Scratch language

Analysis for the Catch Game with Scratch language
    See game: Link
    1. Apple, Bowl(Sprite1)
    2. Apple does 2 works, Bowl does 1 work.
    3. Apple does
        3.1 Moving from the Up to Down 
        3.2 If apple is touched by bowl, move to Top again and add Score 1
    4. Bowl does
        4.1 Moving to left and right


Game Screen and Codes