การรวบรวมข้อมูลเพื่อเชื่อมโยงการกลายพันธุ์กับมะเร็ง เพื่อให้เข้าใจถึงการกำเนิดของมะเร็งถึงเวลาที่มันพัฒนาเป็นมะเร็ง การกลายพันธุ์ทั้งหมดก็อยู่ที่นั่นและเราไม่รู้เสมอไปว่าอันไหนมีส่วนทำให้เกิดมะเร็งได้ การกลายพันธุ์ในคนจำนวนมากจะทำให้เกิดมะเร็งหรือเกี่ยวข้องกับมะเร็ง ยีนจะแพร่หลายและเราไม่รู้ขนาดของเซลล์ที่สามารถมีการกลายพันธุ์ที่ก่อให้เกิดมะเร็งเหล่านี้ได้จริง ๆ

หลังจากทบทวนวรรณกรรมที่มีอยู่แล้ว อีแวนส์ได้รวบรวมชุดข้อมูลจากนักวิจัยซึ่งก่อนหน้านี้ได้ทำการวิจัยเกี่ยวกับการกลายพันธุ์ในเนื้อเยื่อปกติ เขาสอนตัวเองให้เขียนโค้ดในภาษาการเขียนโปรแกรม Python เพื่อที่เขาจะได้ดึงข้อมูลที่เหมาะสมและสร้างกรอบข้อมูลเพื่อจัดหมวดหมู่การกลายพันธุ์ตามยีน เนื้อเยื่อ และอายุของบุคคลที่เกิดขึ้น รวมถึงปัจจัยอื่นๆ เซลล์นิวเคลียสประมาณ 3 ล้านล้านเซลล์ในร่างกายของเรา ดังนั้นหากจะมองในแง่ดีแล้ว เซลล์ 100 พันล้านเซลล์ที่มีการกลายพันธุ์ของเนื้องอกนั้นไม่ใช่ส่วนใหญ่ของจำนวนเซลล์ทั้งหมดของเรา แต่นั่นเป็นจำนวนที่สูงอย่างน่าประหลาดใจเมื่อพิจารณาว่าใช้เวลาเพียงเซลล์เดียวในการทำให้เกิดมะเร็ง หากมีเซลล์นับพันล้านเซลล์ที่มีการกลายพันธุ์เหล่านี้แต่ไม่มีข้อบ่งชี้ของมะเร็ง