๐Ÿ˜€ ๋ฉค๋ฒ„ ์†Œ๊ฐœ

<aside> ๐Ÿ’ก DIYA์—์„œ ํ™œ๋™ํ•˜๋Š” ๋ฉค๋ฒ„๋“ค๋กœ ๊ตฌ์„ฑ๋˜์–ด์žˆ์œผ๋ฉฐ ์ถ”ํ›„ ์ธ์› ๋ณด๊ฐ• ์˜ˆ์ • !

โœจ ํ”„๋กœ์ ํŠธ ์†Œ๊ฐœ

<aside> ๐Ÿ’ก K-MolOCR์€ ํ™”ํ•™ ๊ณ„์—ด ์—ฐ๊ตฌ ์ข…์‚ฌ์ž๋“ค์„ ์œ„ํ•œ ๋ถ„์ž ๊ตฌ์กฐ ์ด๋ฏธ์ง€ ๊ฒ€์ƒ‰ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ด์ฃผ๋Š” ์„œ๋น„์Šค์ž…๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž ์นœํ™”์ ์ธ ๊ด€์ ์—์„œ ๋ณด๋‹ค ์‰ฝ๊ฒŒ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋„๋ก ์›น ์„œ๋น„์Šค ํ˜•ํƒœ๋กœ ๋ฌด๋ฃŒ๋กœ ์ œ๊ณตํ•ด์ฃผ๋Š” ์‹œํ—˜์šฉ ์„œ๋น„์Šค์ž…๋‹ˆ๋‹ค.

Untitled

                            โฌ‡๏ธ

C=CC(=O)N1CC(Nc2ncnc3c(F)c(-c4ccc(F)c5sc(N)nc45)c(Cl)cc23)C1

</aside>

โšฝย  ํ”„๋กœ์ ํŠธ ๋ฐฉํ–ฅ

<aside> ๐Ÿ’ก ๋ฌด์—‡์„ ์ œ๊ณตํ•  ๊ฒƒ์ธ๊ฐ€?

</aside>

โœ๏ธ Scheme and Milestone

<aside> ๐Ÿ’ก ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜ ์›น ์„œ๋น„์Šค ๊ธฐํš โ†’ ์›น ์„œ๋น„์Šค ๋ฐฐํฌ์— ์ด๋ฅด๊ธฐ๊นŒ์ง€ ํ”„๋กœ์ ํŠธ๋ฅผ ์•„๋ž˜์™€ ๊ฐ™์€ ์ˆœ์„œ๋กœ ์ง„ํ–‰ํ•  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค.

๐Ÿง Strategies to train image2smiles

<aside> ๐Ÿ’ก Preprocessing

: label(smiles)์ด ์ฃผ์–ด์ง„ real image(pdf๋‚ด์˜ ๋ถ„์ž ์ด๋ฏธ์ง€)๋ฅผ ๋Œ€๋Ÿ‰์œผ๋กœ ์–ป๋Š” ๊ฒƒ์€ ์–ด๋ ค์›€.

  1. PubChem, Surechembl๋“ฑ์˜ ์‚ฌ์ดํŠธ์—์„œ smiles ๋ฆฌ์ŠคํŠธ๋ฅผ ์–ป๋Š”๋‹ค.
  2. rdkit ํŒจํ‚ค์ง€๋ฅผ ์ด์šฉํ•˜์—ฌ smiles๋กœ๋ถ€ํ„ฐ ๋ถ„์ž ์ด๋ฏธ์ง€๋ฅผ ์–ป๋Š”๋‹ค.
  3. rdkit ํ•จ์ˆ˜์™€ ์ด๋ฏธ์ง€ augmentation์„ ์ด์šฉํ•˜์—ฌ pdf ์ด๋ฏธ์ง€์™€ ์œ ์‚ฌํ•˜๊ฒŒ ๋ณ€ํ˜•ํ•œ๋‹ค.

ex) C=CC(=O)N1CC(Nc2ncnc3c(F)c(-c4ccc(F)c5sc(N)nc45)c(Cl)cc23)C1

                         โฌ‡๏ธ

Untitled

                            โฌ‡๏ธ

00000006.png

</aside>

<aside> ๐Ÿ’ก Model

: CNN(Encoder) + Transformer(Decoder)

</aside>

๐Ÿ’พ ์ฐธ๊ณ  ์ž๋ฃŒ ๋ฐ ๋ฌธํ—Œ ๋ชจ์Œ

Repository

๐Ÿ” ํ”„๋กœ์ ํŠธ ์ง„ํ–‰ ์ผ์ •

์ง„ํ–‰ ์ผ์ •ํ‘œ

โœจ ํ”„๋กœ์ ํŠธ ํšŒ์˜ ์ผ์ •ํ‘œ

ํšŒ์˜ ์ง„ํ–‰ ์ผ์ • ๋ฐ ๋…ผ์˜ ๋‚ด์šฉ