Atomstrom/atomstrom.py

#!/usr/bin/env python
#coding: utf-8

from models import Base, Feed, Feedinfo, Entry

from sqlalchemy import create_engine, desc
from sqlalchemy.orm import sessionmaker
from datetime import datetime
from ddate import ddate
import feedparser
import sys
import codecs
#import urllib
import urllib2
#import hn
import html2text
import ConfigParser
from argparse import ArgumentParser
from cStringIO import StringIO
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText
from email.header import Header
from email import Charset
from email.generator import Generator
import smtplib

def send_mail(sender, receiver, subject, body):
    print 'sending to %s: %s' % (receiver[0], subject)
    Charset.add_charset('utf-8', Charset.QP, Charset.QP, 'utf-8')
    mail = MIMEMultipart('alternative')
    mail['Subject'] = "%s" % Header(subject, 'utf-8')
    mail['From'] = "\"%s\" <%s>" % (Header(sender[0], 'utf-8'), sender[1])
    mail['To'] = "\"%s\" <%s>" % (Header(receiver[0], 'utf-8'), receiver[1])
    textpart = MIMEText(body, 'plain', 'utf-8')
    mail.attach(textpart)
    str_io = StringIO()
    gen = Generator(str_io, False)
    gen.flatten(mail)
    s = smtplib.SMTP('localhost')
    s.sendmail("", receiver[1], str_io.getvalue())

def truncate_text(content, length=100, suffix='...'):
    content = " ".join(content.split())
    if len(content) <= length:
        return content
    else:
        return content[:length].rsplit(' ', 1)[0]+suffix

def mail_daily_digest(session, sender, receiver, prefix):
    print 'mailing daily digest...'
    entries = session.query(Feed, Feedinfo, Entry).\
                filter(Feed.id == Feedinfo.feed_id).\
                filter(Feed.id == Entry.feed_id).\
                filter(Feed.enabled == 1).\
                filter(Feed.daily == 1).\
                filter(Entry.sent == None).\
                order_by(desc(Entry.firstfetched), Feedinfo.title, Entry.title).\
                all()
    body = ''
    count = 0
    for feed, feedinfo, entry in entries:
        count = count + 1
        link = entry.link
        if entry.resolvedlink:
            link = entry.resolvedlink
        try:
            body = body + '=> %s - %s\n' % (entry.firstfetched.strftime('%y%m%d-%H%M'), feedinfo.title)
            body = body + '>> %s\n' % entry.title
            body = body + '%s\n' % truncate_text(entry.get_text(), 250)
            body = body + '%s\n\n' % link
        except:
            print 'ERROR processing entry %s' % entry.id;
            print sys.exc_info()
            print 'not sending mail'
            return
    if count > 0:
        today = datetime.now()
        subject = '%s (%s) - %d entries' % (today.strftime('%y%m%d'), today.strftime('%A'), count)
        body = '%s\n\n%s\n\n%s' % (subject, ddate(), body)
        if prefix != '':
            subject = '%s %s' % (prefix, subject)
        send_mail(sender, receiver, subject, body)
        for feed, feedinfo, entry in entries:
            entry.sent = datetime.now()
    else:
        print 'no unmailed digest-entries found... not sending mail.'

def mail_single_entry(feed, feedinfo, entry, sender, receiver, prefix):
    subject = '%s' % (entry.title)
    if prefix != '':
        subject = '%s %s' % (prefix, subject)
    link = entry.link
    if entry.resolvedlink:
        link = entry.resolvedlink
    body = '%s\n\n' % entry.get_text()
    body = body + '%s\n' % feedinfo.link
    body = body + '%s\n' % link
    sender[0] = feedinfo.title
    send_mail(sender, receiver, subject, body)
    entry.sent = datetime.now()

def mail_single_entries(session, sender, receiver, prefix):
    print 'mailing single entries...'
    count = 0
    entries = session.query(Feed, Feedinfo, Entry).\
                filter(Feed.id == Feedinfo.feed_id).\
                filter(Feed.id == Entry.feed_id).\
                filter(Feed.enabled == 1).\
                filter(Feed.daily == 0 or Feed.daily == None).\
                filter(Entry.sent == None).\
                all()
    for feed, feedinfo, entry in entries:
        mail_single_entry(feed, feedinfo, entry, sender, receiver, prefix)
        count = count + 1
    if count > 0:
        print 'sent %d mails' % count
    else:
        print 'no unmailed single entries found... not sending mail.'

def fetch_readability(link):
    text = hn.upgradeLink(link)
    text = text.decode('utf8')
    return text

def fetch_full_page(link):
    opener = urllib.FancyURLopener({})
    response = opener.open(link)
    html = response.read()
    html = html.decode('utf8')
    text = html2text.html2text(html)
    return text.encode('latin-1', 'replace')

def process_feed_entry(session, feed, entry):
    thisentry = session.query(Entry).\
                filter(Entry.title == entry.title).\
                filter(Entry.link == entry.link).\
                first()
    if thisentry:
        print '  entry already known <%s>' % entry.title
        thisentry.lastfetched = datetime.now()
        session.commit()
        return 0
    else:
        print '  new entry <%s>' % entry.title
        thisentry = Entry(entry)
        if feed.resolveredirects:
            print '    fetching final link <%s>' % entry.link
            request = urllib2.Request(entry.link)
            opener = urllib2.build_opener()
            result = opener.open(request)
            thisentry.resolvedlink = result.url
            print '    final link: <%s>' % result.url
        if feed.fullpage:
            print '    fetching full page <%s>' % entry.link
            thisentry.fullpage = fetch_full_page(entry.link)
        if feed.readability:
            print '    fetching readability <%s>' % entry.link
            thisentry.readability = fetch_readability(entry.link)
        if feed.html2textcontent:
            print '    converting summary'
            h2t = html2text.HTML2Text()
            h2t.body_width = 0
            h2t.inline_links = False
            if feed.html2textignoreimages:
                h2t.ignore_images = True
            if feed.contentcolumn == 'summary':
                thisentry.summary = h2t.handle(thisentry.summary)
            elif feed.contentcolumn == 'content':
                thisentry.content = h2t.handle(thisentry.content)
            elif feed.contentcolumn == 'fullpage':
                thisentry.fullpage = h2t.handle(thisentry.fullpage)
            elif feed.contentcolumn == 'readability':
                thisentry.readability = h2t.handle(thisentry.readability)
        feed.entry.append(thisentry)
        session.commit()
        return 1

def fetch_single_feed(session, feed):
    print 'processing %s' % feed.url
    thisfeedinfo = session.query(Feedinfo).\
                filter(Feedinfo.feed_id==feed.id).\
                first()
    fetched = False
    if thisfeedinfo:
        feed.feedinfo = thisfeedinfo
        if (not feed.feedinfo.nextfetch) or (feed.feedinfo.nextfetch < datetime.now()):
            print 'feed known, fetching...'
            try:
                parser = feedparser.parse(feed.url)
                fetched = True
                feed.feedinfo.update(parser)
            except:
                print 'ERROR parsing feed'
                print sys.exc_info()
        else:
            print 'not fetching before: %s' % feed.feedinfo.nextfetch
    else:
        print 'feed seems to be new, fetching...'
        try:
            parser = feedparser.parse(feed.url)
            fetched = True
            feed.feedinfo = Feedinfo(parser)
        except:
            print 'ERROR parsing feed'
            print sys.exc_info()

    if fetched:
        print 'processing feed entries:'
        entries_new = 0
        entries_total = 0
        for entry in parser.entries:
            entries_total = entries_total + 1
            entries_new = entries_new + process_feed_entry(session, feed, entry)
            session.commit()
        print 'updated %d of %d entries' % (entries_new, entries_total)

def fetch_all_feeds(session):
    print 'fetching all feeds...'
    for feed in session.query(Feed).filter_by(enabled=1).order_by(Feed.id):
        fetch_single_feed(session, feed)
        print

if __name__ == '__main__':
    streamWriter = codecs.lookup('utf-8')[-1]
    sys.stdout = streamWriter(sys.stdout)

    config = ConfigParser.ConfigParser()
    config.read('atomstrom.conf')

    dbconnectstring = '%s://%s:%s@%s/%s?charset=utf8' % (
        config.get('database', 'engine'),
        config.get('database', 'user'),
        config.get('database', 'password'),
        config.get('database', 'hostname'),
        config.get('database', 'database'),
    )
    engine = create_engine(dbconnectstring)
    Base.metadata.create_all(engine)

    Session = sessionmaker(bind=engine)
    session = Session()

    #session.add(Feed('http://www.heise.de/newsticker/heise-atom.xml', 1, 0, 0, 1, 1))
    #session.add(Feed('http://blog.schatenseite.de/feed/', 1, 0, 0, 1, 1))

    parser = ArgumentParser(description='Fetch RSS- and Atom-feeds and send mails.')
    parser.add_argument('-f', '--fetch', action='store_true', help='fetch all feeds')
    parser.add_argument('-s', '--single', action='store_true', help='send single mails')
    parser.add_argument('-d', '--daily', action='store_true', help='send daily digest')
    args = parser.parse_args()

    if args.fetch:
        fetch_all_feeds(session)
    if args.single:
        sender = [config.get('email', 'sender_name'), config.get('email', 'sender_address')]
        receiver = [config.get('email', 'receiver_name'), config.get('email', 'receiver_address')]
        prefix = config.get('email', 'prefix_single')
        mail_single_entries(session, sender, receiver, prefix)
    if args.daily:
        sender = [config.get('email', 'sender_name'), config.get('email', 'sender_address')]
        receiver = [config.get('email', 'receiver_name'), config.get('email', 'receiver_address')]
        prefix = config.get('email', 'prefix_digest')
        mail_daily_digest(session, sender, receiver, prefix)
    if not (args.fetch or args.single or args.daily):
        parser.print_help()

    session.commit()
initial commit 2010-10-26 21:02:37 +00:00			`#!/usr/bin/env python`
rewrote mail function, to avoid warnings on mailserver 2013-03-22 21:05:15 +00:00			`#coding: utf-8`
initial commit 2010-10-26 21:02:37 +00:00
refactored so the data model lives in its own module 2013-03-26 19:20:51 +00:00			`from models import Base, Feed, Feedinfo, Entry`

fixed missing import 2013-03-27 19:25:37 +00:00			`from sqlalchemy import create_engine, desc`
refactored so the data model lives in its own module 2013-03-26 19:20:51 +00:00			`from sqlalchemy.orm import sessionmaker`
fuzzied time between feed fetches 2013-03-28 22:35:20 +00:00			`from datetime import datetime`
include discordian date into mail digest ;-) 2013-04-03 18:35:08 +00:00			`from ddate import ddate`
initial commit 2010-10-26 21:02:37 +00:00			`import feedparser`
completed data model, added some debug-output 2010-10-28 22:13:00 +00:00			`import sys`
refactored so the data model lives in its own module 2013-03-26 19:20:51 +00:00			`import codecs`
			`#import urllib`
implemented resolving of url redirects 2013-03-20 19:30:54 +00:00			`import urllib2`
refactored so the data model lives in its own module 2013-03-26 19:20:51 +00:00			`#import hn`
improved debug output, included html2text 2010-10-31 12:30:26 +00:00			`import html2text`
moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`import ConfigParser`
optionparser is deprecated, use argumentparser instead 2013-04-03 20:49:53 +00:00			`from argparse import ArgumentParser`
rewrote mail function, to avoid warnings on mailserver 2013-03-22 21:05:15 +00:00			`from cStringIO import StringIO`
			`from email.mime.multipart import MIMEMultipart`
			`from email.mime.text import MIMEText`
			`from email.header import Header`
			`from email import Charset`
			`from email.generator import Generator`
			`import smtplib`
initial commit 2010-10-26 21:02:37 +00:00
modified mail subject prefixes 2013-03-19 19:09:44 +00:00			`def send_mail(sender, receiver, subject, body):`
rewrote mail function, to avoid warnings on mailserver 2013-03-22 21:05:15 +00:00			`print 'sending to %s: %s' % (receiver[0], subject)`
			`Charset.add_charset('utf-8', Charset.QP, Charset.QP, 'utf-8')`
			`mail = MIMEMultipart('alternative')`
			`mail['Subject'] = "%s" % Header(subject, 'utf-8')`
			`mail['From'] = "\"%s\" <%s>" % (Header(sender[0], 'utf-8'), sender[1])`
			`mail['To'] = "\"%s\" <%s>" % (Header(receiver[0], 'utf-8'), receiver[1])`
			`textpart = MIMEText(body, 'plain', 'utf-8')`
			`mail.attach(textpart)`
			`str_io = StringIO()`
			`gen = Generator(str_io, False)`
			`gen.flatten(mail)`
			`s = smtplib.SMTP('localhost')`
			`s.sendmail("", receiver[1], str_io.getvalue())`
implemented mail_single_entry() 2010-10-30 09:16:37 +00:00
digest-mails: truncate body text, remove spare whitespace 2013-03-27 21:34:11 +00:00			`def truncate_text(content, length=100, suffix='...'):`
			`content = " ".join(content.split())`
			`if len(content) <= length:`
			`return content`
			`else:`
			`return content[:length].rsplit(' ', 1)[0]+suffix`

make email parameters configurable 2013-03-19 18:32:10 +00:00			`def mail_daily_digest(session, sender, receiver, prefix):`
implemented first version of mail_daily_digest() 2010-10-30 09:39:19 +00:00			`print 'mailing daily digest...'`
implemented mail sending 2013-03-19 22:03:33 +00:00			`entries = session.query(Feed, Feedinfo, Entry).\`
			`filter(Feed.id == Feedinfo.feed_id).\`
			`filter(Feed.id == Entry.feed_id).\`
			`filter(Feed.enabled == 1).\`
			`filter(Feed.daily == 1).\`
			`filter(Entry.sent == None).\`
			`order_by(desc(Entry.firstfetched), Feedinfo.title, Entry.title).\`
			`all()`
implemented first version of mail_daily_digest() 2010-10-30 09:39:19 +00:00			`body = ''`
improved mail text format, included dates and times 2010-10-31 10:05:28 +00:00			`count = 0`
implemented mail sending 2013-03-19 22:03:33 +00:00			`for feed, feedinfo, entry in entries:`
improved mail text format, included dates and times 2010-10-31 10:05:28 +00:00			`count = count + 1`
implemented resolving of url redirects 2013-03-20 19:30:54 +00:00			`link = entry.link`
			`if entry.resolvedlink:`
			`link = entry.resolvedlink`
fixed encoding of digest-mails 2013-03-21 20:42:28 +00:00			`try:`
			`body = body + '=> %s - %s\n' % (entry.firstfetched.strftime('%y%m%d-%H%M'), feedinfo.title)`
include discordian date into mail digest ;-) 2013-04-03 18:35:08 +00:00			`body = body + '>> %s\n' % entry.title`
minor change in db-structure, made mailtext column selectable 2013-04-02 22:06:06 +00:00			`body = body + '%s\n' % truncate_text(entry.get_text(), 250)`
fixed encoding of digest-mails 2013-03-21 20:42:28 +00:00			`body = body + '%s\n\n' % link`
			`except:`
			`print 'ERROR processing entry %s' % entry.id;`
			`print sys.exc_info()`
			`print 'not sending mail'`
			`return`
implemented mail sending 2013-03-19 22:03:33 +00:00			`if count > 0:`
			`today = datetime.now()`
			`subject = '%s (%s) - %d entries' % (today.strftime('%y%m%d'), today.strftime('%A'), count)`
include discordian date into mail digest ;-) 2013-04-03 18:35:08 +00:00			`body = '%s\n\n%s\n\n%s' % (subject, ddate(), body)`
implemented mail sending 2013-03-19 22:03:33 +00:00			`if prefix != '':`
			`subject = '%s %s' % (prefix, subject)`
			`send_mail(sender, receiver, subject, body)`
			`for feed, feedinfo, entry in entries:`
			`entry.sent = datetime.now()`
			`else:`
			`print 'no unmailed digest-entries found... not sending mail.'`
implemented mail_single_entry() 2010-10-30 09:16:37 +00:00
make email parameters configurable 2013-03-19 18:32:10 +00:00			`def mail_single_entry(feed, feedinfo, entry, sender, receiver, prefix):`
modified mail subject prefixes 2013-03-19 19:09:44 +00:00			`subject = '%s' % (entry.title)`
			`if prefix != '':`
			`subject = '%s %s' % (prefix, subject)`
implemented resolving of url redirects 2013-03-20 19:30:54 +00:00			`link = entry.link`
			`if entry.resolvedlink:`
			`link = entry.resolvedlink`
minor change in db-structure, made mailtext column selectable 2013-04-02 22:06:06 +00:00			`body = '%s\n\n' % entry.get_text()`
reformatted mail 2013-03-19 19:24:49 +00:00			`body = body + '%s\n' % feedinfo.link`
implemented resolving of url redirects 2013-03-20 19:30:54 +00:00			`body = body + '%s\n' % link`
rewrote mail function, to avoid warnings on mailserver 2013-03-22 21:05:15 +00:00			`sender[0] = feedinfo.title`
modified mail subject prefixes 2013-03-19 19:09:44 +00:00			`send_mail(sender, receiver, subject, body)`
implemented mail sending 2013-03-19 22:03:33 +00:00			`entry.sent = datetime.now()`
implemented mail_single_entry() 2010-10-30 09:16:37 +00:00
make email parameters configurable 2013-03-19 18:32:10 +00:00			`def mail_single_entries(session, sender, receiver, prefix):`
implemented first version of mail_daily_digest() 2010-10-30 09:39:19 +00:00			`print 'mailing single entries...'`
implemented mail sending 2013-03-19 22:03:33 +00:00			`count = 0`
			`entries = session.query(Feed, Feedinfo, Entry).\`
			`filter(Feed.id == Feedinfo.feed_id).\`
			`filter(Feed.id == Entry.feed_id).\`
			`filter(Feed.enabled == 1).\`
fixed sending of single mails 2013-03-22 19:47:20 +00:00			`filter(Feed.daily == 0 or Feed.daily == None).\`
implemented mail sending 2013-03-19 22:03:33 +00:00			`filter(Entry.sent == None).\`
			`all()`
			`for feed, feedinfo, entry in entries:`
make email parameters configurable 2013-03-19 18:32:10 +00:00			`mail_single_entry(feed, feedinfo, entry, sender, receiver, prefix)`
implemented mail sending 2013-03-19 22:03:33 +00:00			`count = count + 1`
			`if count > 0:`
			`print 'sent %d mails' % count`
			`else:`
			`print 'no unmailed single entries found... not sending mail.'`
implemented mail_single_entry() 2010-10-30 09:16:37 +00:00
implemented readability-support 2010-10-29 22:21:24 +00:00			`def fetch_readability(link):`
			`text = hn.upgradeLink(link)`
			`text = text.decode('utf8')`
			`return text`

fetch full page html 2010-10-29 07:09:25 +00:00			`def fetch_full_page(link):`
			`opener = urllib.FancyURLopener({})`
			`response = opener.open(link)`
improved debug output, included html2text 2010-10-31 12:30:26 +00:00			`html = response.read()`
			`html = html.decode('utf8')`
			`text = html2text.html2text(html)`
			`return text.encode('latin-1', 'replace')`
fetch full page html 2010-10-29 07:09:25 +00:00
moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`def process_feed_entry(session, feed, entry):`
obsoleted exception when parsing new entries 2013-03-21 21:38:44 +00:00			`thisentry = session.query(Entry).\`
			`filter(Entry.title == entry.title).\`
			`filter(Entry.link == entry.link).\`
			`first()`
			`if thisentry:`
improved debug output, included html2text 2010-10-31 12:30:26 +00:00			`print ' entry already known <%s>' % entry.title`
obsoleted exception when parsing new entries 2013-03-21 21:38:44 +00:00			`thisentry.lastfetched = datetime.now()`
			`session.commit()`
improved debug output, included html2text 2010-10-31 12:30:26 +00:00			`return 0`
obsoleted exception when parsing new entries 2013-03-21 21:38:44 +00:00			`else:`
reinserted log output 2013-03-28 21:49:51 +00:00			`print ' new entry <%s>' % entry.title`
fetch full page html 2010-10-29 07:09:25 +00:00			`thisentry = Entry(entry)`
implemented resolving of url redirects 2013-03-20 19:30:54 +00:00			`if feed.resolveredirects:`
			`print ' fetching final link <%s>' % entry.link`
			`request = urllib2.Request(entry.link)`
			`opener = urllib2.build_opener()`
			`result = opener.open(request)`
			`thisentry.resolvedlink = result.url`
			`print ' final link: <%s>' % result.url`
implemented mail_single_entry() 2010-10-30 09:16:37 +00:00			`if feed.fullpage:`
improved debug output, included html2text 2010-10-31 12:30:26 +00:00			`print ' fetching full page <%s>' % entry.link`
fetch full page html 2010-10-29 07:09:25 +00:00			`thisentry.fullpage = fetch_full_page(entry.link)`
implemented mail_single_entry() 2010-10-30 09:16:37 +00:00			`if feed.readability:`
improved debug output, included html2text 2010-10-31 12:30:26 +00:00			`print ' fetching readability <%s>' % entry.link`
implemented readability-support 2010-10-29 22:21:24 +00:00			`thisentry.readability = fetch_readability(entry.link)`
minor change in db-structure, made mailtext column selectable 2013-04-02 22:06:06 +00:00			`if feed.html2textcontent:`
html2text functionality for entry summary 2010-10-31 13:20:12 +00:00			`print ' converting summary'`
updated html2text-module to version 3.200.3 2013-03-20 22:20:54 +00:00			`h2t = html2text.HTML2Text()`
			`h2t.body_width = 0`
improve format of html2text-output 2013-04-03 20:29:40 +00:00			`h2t.inline_links = False`
new feature: ignore images in html2text 2013-03-20 22:28:48 +00:00			`if feed.html2textignoreimages:`
			`h2t.ignore_images = True`
minor change in db-structure, made mailtext column selectable 2013-04-02 22:06:06 +00:00			`if feed.contentcolumn == 'summary':`
			`thisentry.summary = h2t.handle(thisentry.summary)`
			`elif feed.contentcolumn == 'content':`
			`thisentry.content = h2t.handle(thisentry.content)`
			`elif feed.contentcolumn == 'fullpage':`
			`thisentry.fullpage = h2t.handle(thisentry.fullpage)`
			`elif feed.contentcolumn == 'readability':`
			`thisentry.readability = h2t.handle(thisentry.readability)`
fetch full page html 2010-10-29 07:09:25 +00:00			`feed.entry.append(thisentry)`
obsoleted exception when parsing new entries 2013-03-21 21:38:44 +00:00			`session.commit()`
improved debug output, included html2text 2010-10-31 12:30:26 +00:00			`return 1`
refactoring, improvement of debug-output 2010-10-28 22:28:25 +00:00
moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`def fetch_single_feed(session, feed):`
implemented fetch-frequency for feeds 2013-03-19 20:18:38 +00:00			`print 'processing %s' % feed.url`
removed exception handler, implemented clean algorithm 2013-03-26 20:26:59 +00:00			`thisfeedinfo = session.query(Feedinfo).\`
			`filter(Feedinfo.feed_id==feed.id).\`
			`first()`
implemented fetch-frequency for feeds 2013-03-19 20:18:38 +00:00			`fetched = False`
removed exception handler, implemented clean algorithm 2013-03-26 20:26:59 +00:00			`if thisfeedinfo:`
			`feed.feedinfo = thisfeedinfo`
fuzzied time between feed fetches 2013-03-28 22:35:20 +00:00			`if (not feed.feedinfo.nextfetch) or (feed.feedinfo.nextfetch < datetime.now()):`
removed exception handler, implemented clean algorithm 2013-03-26 20:26:59 +00:00			`print 'feed known, fetching...'`
fixed missing import 2013-03-27 19:25:37 +00:00			`try:`
			`parser = feedparser.parse(feed.url)`
			`fetched = True`
			`feed.feedinfo.update(parser)`
			`except:`
			`print 'ERROR parsing feed'`
			`print sys.exc_info()`
implemented fetch-frequency for feeds 2013-03-19 20:18:38 +00:00			`else:`
fuzzied time between feed fetches 2013-03-28 22:35:20 +00:00			`print 'not fetching before: %s' % feed.feedinfo.nextfetch`
removed exception handler, implemented clean algorithm 2013-03-26 20:26:59 +00:00			`else:`
			`print 'feed seems to be new, fetching...'`
fixed missing import 2013-03-27 19:25:37 +00:00			`try:`
			`parser = feedparser.parse(feed.url)`
			`fetched = True`
			`feed.feedinfo = Feedinfo(parser)`
			`except:`
			`print 'ERROR parsing feed'`
			`print sys.exc_info()`
initial commit 2010-10-26 21:02:37 +00:00
implemented fetch-frequency for feeds 2013-03-19 20:18:38 +00:00			`if fetched:`
			`print 'processing feed entries:'`
			`entries_new = 0`
			`entries_total = 0`
			`for entry in parser.entries:`
			`entries_total = entries_total + 1`
			`entries_new = entries_new + process_feed_entry(session, feed, entry)`
			`session.commit()`
			`print 'updated %d of %d entries' % (entries_new, entries_total)`
refactoring, improvement of debug-output 2010-10-28 22:28:25 +00:00
moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`def fetch_all_feeds(session):`
implemented first version of mail_daily_digest() 2010-10-30 09:39:19 +00:00			`print 'fetching all feeds...'`
refactoring, improvement of debug-output 2010-10-28 22:28:25 +00:00			`for feed in session.query(Feed).filter_by(enabled=1).order_by(Feed.id):`
moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`fetch_single_feed(session, feed)`
refactoring, improvement of debug-output 2010-10-28 22:28:25 +00:00			`print`

implemented first version of mail_daily_digest() 2010-10-30 09:39:19 +00:00			`if __name__ == '__main__':`
refactored so the data model lives in its own module 2013-03-26 19:20:51 +00:00			`streamWriter = codecs.lookup('utf-8')[-1]`
			`sys.stdout = streamWriter(sys.stdout)`

moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`config = ConfigParser.ConfigParser()`
			`config.read('atomstrom.conf')`

globally fixed encoding issues, changed database table types 2013-03-21 22:43:10 +00:00			`dbconnectstring = '%s://%s:%s@%s/%s?charset=utf8' % (`
moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`config.get('database', 'engine'),`
			`config.get('database', 'user'),`
			`config.get('database', 'password'),`
			`config.get('database', 'hostname'),`
			`config.get('database', 'database'),`
			`)`
			`engine = create_engine(dbconnectstring)`
			`Base.metadata.create_all(engine)`

			`Session = sessionmaker(bind=engine)`
			`session = Session()`

			`#session.add(Feed('http://www.heise.de/newsticker/heise-atom.xml', 1, 0, 0, 1, 1))`
			`#session.add(Feed('http://blog.schatenseite.de/feed/', 1, 0, 0, 1, 1))`

optionparser is deprecated, use argumentparser instead 2013-04-03 20:49:53 +00:00			`parser = ArgumentParser(description='Fetch RSS- and Atom-feeds and send mails.')`
			`parser.add_argument('-f', '--fetch', action='store_true', help='fetch all feeds')`
			`parser.add_argument('-s', '--single', action='store_true', help='send single mails')`
			`parser.add_argument('-d', '--daily', action='store_true', help='send daily digest')`
			`args = parser.parse_args()`
command line arguments to select action 2010-10-31 18:46:13 +00:00
optionparser is deprecated, use argumentparser instead 2013-04-03 20:49:53 +00:00			`if args.fetch:`
moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`fetch_all_feeds(session)`
optionparser is deprecated, use argumentparser instead 2013-04-03 20:49:53 +00:00			`if args.single:`
rewrote mail function, to avoid warnings on mailserver 2013-03-22 21:05:15 +00:00			`sender = [config.get('email', 'sender_name'), config.get('email', 'sender_address')]`
			`receiver = [config.get('email', 'receiver_name'), config.get('email', 'receiver_address')]`
modified mail subject prefixes 2013-03-19 19:09:44 +00:00			`prefix = config.get('email', 'prefix_single')`
make email parameters configurable 2013-03-19 18:32:10 +00:00			`mail_single_entries(session, sender, receiver, prefix)`
optionparser is deprecated, use argumentparser instead 2013-04-03 20:49:53 +00:00			`if args.daily:`
rewrote mail function, to avoid warnings on mailserver 2013-03-22 21:05:15 +00:00			`sender = [config.get('email', 'sender_name'), config.get('email', 'sender_address')]`
			`receiver = [config.get('email', 'receiver_name'), config.get('email', 'receiver_address')]`
make email parameters configurable 2013-03-19 18:32:10 +00:00			`prefix = config.get('email', 'prefix_digest')`
			`mail_daily_digest(session, sender, receiver, prefix)`
optionparser is deprecated, use argumentparser instead 2013-04-03 20:49:53 +00:00			`if not (args.fetch or args.single or args.daily):`
show help if no action option is given 2013-03-19 06:15:24 +00:00			`parser.print_help()`
initial commit 2010-10-26 21:02:37 +00:00
moved configuration to external file, plus a little refactoring 2013-03-18 18:28:47 +00:00			`session.commit()`