Hello Everyone - This is an update to a discussion had on the python users group, and I thought I would share it here.<br>I&#39;m not sure if any of you out there have trouble filtering webform input - even with the character encoding library in Python there are times when it still doesn&#39;t get it right.<br>
<br>We finally seem to have come across a solution that works everytime... even when there are multiple character encodings within a single string, microsoft office character encodings, or html pasted INTO the form, ETC ETC ETC ...<br>
<br>Just passing everything through Tidy pretty much fixes everything and makes it comply.<br>So for anyone attempting to sanitize multi-lingual form-input from the web good-luck and hopefully this solves your problems.<br>
<br><a href="http://tidy.sourceforge.net/docs/tidy_man.html">http://tidy.sourceforge.net/docs/tidy_man.html</a><br>