ইমেজ মধ্যে টেক্সট সনাক্তকরণ

আমি বর্তমানে একটি প্রকল্পে কাজ করছি এবং আমার লক্ষ্য একটি ছবিতে টেক্সট সনাক্ত করা হয়। পাঠ্যক্রম OCR'a এখনও আমার অভিপ্রায় নয়। আমি মূলত একটি ইমেজ মধ্যে টেক্সট সীমানা পেতে চান। আমি ম্যানিপুলেশন জন্য AForge.Net ইমেজিং উপাদান ব্যবহার করছি। কিছু অর্থে কোন সাহায্য বা অন্য কোন?

আপডেট 2/5/09: আমি পরে আমার প্রকল্পের অন্য রুট বরাবর গিয়েছিলাম। যাইহোক আমি MODI (মাইক্রোসফ্ট অফিস ডকুমেন্ট ইমেজিং) ব্যবহার করে পাঠ্য প্রাপ্ত করার চেষ্টা করেছি। এটি আপনাকে একটি ইমেজ OCR করতে এবং কিছু সহজে সঙ্গে এটি টেক্সট টান দেয়।

0

4 উত্তর

এটি গবেষণা একটি সক্রিয় এলাকা। এই বিষয়ের উপর আক্ষরিক অর্থেই একাডেমিক কাগজপত্র রয়েছে। বিশেষ করে w / o আরো ডেটালেস আপনাকে সহায়তা দিতে কঠিন হতে যাচ্ছে। আপনি নির্দিষ্ট ধরনের টেক্সট খুঁজছেন? ফন্ট? ইংরেজী-শুধুমাত্র? আপনি কি একাডেমিক সাহিত্যের সাথে পরিচিত?

"পাঠ্য সনাক্তকরণ" কোনও OCR (অপটিক্যাল অক্ষর স্বীকৃতি) সিস্টেমের একটি মান সমস্যা এবং ফলস্বরূপ, এটির সাথে চুক্তি করা ইন্টারভবসের উপর অনেক বিট কোড আছে।

আমি গুগল থেকে লিঙ্কের পাইলস তালিকা শুরু করতে পারে কিন্তু আমি আপনাকে "টেক্সট সনাক্তকরণ" জন্য একটি অনুসন্ধান করতে এবং পড়া শুরু পরামর্শ :)। পাশাপাশি যথেষ্ট উদাহরণ কোড উপলব্ধ আছে।

0
যোগ

যদি আপনি এটির জন্য একটি অনলাইন API ব্যবহার করে ঠিক থাকেন, তাহলে এপিআই এ http: //www.wisetrend এ com / wisetrend_ocr_cloud.shtml শুধুমাত্র OCR ছাড়াও টেক্সট সনাক্তকরণ করতে পারে।

0
যোগ

একটি ইমেজ ভিতরে টেক্সট স্বীকৃতি সত্যিকারের যে ক্ষেত্রের গবেষকদের জন্য একটি গরম বিষয়, কিন্তু শুধুমাত্র যখন নিয়ন্ত্রণ আউট বৃদ্ধি শুরু যখন ক্যাপচা এর স্প্যাম বট বিরুদ্ধে প্রতিরক্ষা ক্ষেত্রে "আদর্শ" হয়ে ওঠে। কেন ক্যাপচা সুরক্ষা হিসাবে ব্যবহার? ভাল কারণ এটি একটি ইমেজ ভিতরে (এবং পড়া) টেক্সট সনাক্ত করার জন্য খুব কঠিন ছিল!

আমি ক্যাপচা উল্লেখ কারণ কারণ সবচেয়ে অগ্রগতি * যে ক্ষুদ্র এলাকায় মধ্যে তৈরি করা হয়, এবং আমি মনে করি যে আপনার সমাধান সেরা খুঁজে পাওয়া যায় নি। বিশেষতঃ ক্যাপচাটি আসলে একটি ক্লান্তিকর চিত্রের ভিতরে পাঠ্য (বা কিছু যা টেক্সটের সাথে মিলিত হয়) সনাক্ত করার পরে এবং সঠিকভাবে অক্ষরগুলিকে পড়ার চেষ্টা করে।

তাই যদি আপনি নিজেকে একটি ভাল ওপেন সোর্স ক্যাপচা ব্রেকিং টুল খুঁজে পেতে পারেন তবে আপনি সম্ভবত আপনার সবগুলি প্রয়োজন আপনার খোঁজা অব্যাহত ...
আপনি সম্ভবত এমনকি সর্বাধিক ডিজিটাল কোডটি ছুঁড়ে ফেলতে পারেন যা ক্যারেক্টার স্বীকৃতিটি পরিচালনা করে, কারণ ওসিআর এর বিকৃত পাঠ্য পড়ার জন্য ব্যবহৃত হয়, যা আপনাকে করতে হবে না।

*: একটি "অ গবেষক" জন্য দৃশ্যমান, ব্যবহারযোগ্য, এবং ব্যবহারিক তথ্যের পরিপ্রেক্ষিতে অগ্রগতি

0
যোগ
ক্যাপচা উল্লেখ করার অন্য কারণ হল সম্ভবত তার "প্রকল্প" কি। :-)
যোগ লেখক T.E.D., উৎস

Stroke width transform can do that for you. That's at least what MS developed for their mobile phone OS. A discussion on the implementation is here at https://stackoverflow.com/

0
যোগ