<div dir="ltr">Hi all,<br><div class="gmail_extra">Just chiming in, since we were mentioned...<br><br><div class="gmail_quote">On Wed, Apr 23, 2014 at 5:10 PM, Simon Li <span dir="ltr">&lt;<a href="mailto:s.p.li@dundee.ac.uk" target="_blank">s.p.li@dundee.ac.uk</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi all<br>
<br>
Now that OMERO 5.0 is out of the way, and OMERO.searcher and WND-CHRM are either released or very close to release, I think it&#39;s time to restart our OMERO.features discussions.<br>
<br>
We got as far as the idea of a 2D table with any number of key-value pairs on each column and row, so for example each row could be as simple as (OmeroType: Image, OmeroId: 123), or in the case of features which are a function of multiple images or channels (OmeroType: Image, OmeroId: 123, Channel1: 0, Channel2: 3), etc. Columns could for example be (FeatureFamily: WndCharm, Feature: Zernike). Each table cell could either be a scalar or array. Retrieving features could be done by providing key-value pairs to be matched.<br>

<br>
All of this is still up for discussion, especially since the implementation of this interface could be challenging and there&#39;s some redundancy/ambiguity. Just to be clear, the above is a conceptual description of how the API would appear to users, the actual back-end could be completely different.<br>

<br>
Lee Kamentsky gave us a use case just before Christmas [1], Chris Coletta and Ivan Cao-berg are planning to summarise how they see WND-CHARM and OMERO.searcher fitting in. I know a few other people are interested in this discussion, so feel free to respond here or in the forums.<br>
</blockquote><div><br></div><div>For us, it&#39;s important to link features to regions of interest, specifically segmentations of whole cells and cellular compartments. The other issues have to do with scalability and the efficiency of retrieving large data sets either by selecting a few features for a large number of images (e.g. up to on the order of 1,000,000 images and 1,000 entries per feature per image) or by selecting many or all features associated with a subset of the regions of interest.</div>
<div><br></div><div>We are also interested in recording tracking data. What&#39;s needed here is the ability to record a link between the region of interest in one frame of a time-series stack with a region of interest in a later frame and you need the flexibility of a many-many relationship to represent cell division and potentially merging. I&#39;m fairly confident that you could encode that sort of thing in a 2-D table which had columns referencing both ROIs.</div>
<div><br></div><div>Finally, we try to capture enough information about the analysis to make it reproducible - things like the pipeline used for the analysis, the GIT hash of the software used to run the analysis and of each image analyzed. I think all of that is easily captured, though, in the tables and I doubt we need any explicit functionality devoted to that. It might be nice to be able to annotate the table itself with attributes in order to document the linking of the analysis results to the experimental protocol, but the linking could be documented using columns in an experiment-wide table.</div>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
A few of us are planning to meet up at the OME Paris meeting- if you&#39;re interested drop me an email.<br>
<br>
Thanks<br>
<br>
Simon<br>
<br>
[1] <a href="http://lists.openmicroscopy.org.uk/pipermail/ome-devel/2013-November/002573.html" target="_blank">http://lists.openmicroscopy.org.uk/pipermail/ome-devel/2013-November/002573.html</a><br>
<br>
<br>
On 7 Nov 2013, at 14:20, Simon Li &lt;<a href="mailto:s.p.li@dundee.ac.uk">s.p.li@dundee.ac.uk</a>&gt; wrote:<br>
<br>
&gt; Some notes from our meeting yesterday:<br>
&gt; <a href="http://www.openmicroscopy.org/site/community/minutes/minigroup/omero-features-meetings/2013-11-06-omero-features-google-hangout" target="_blank">http://www.openmicroscopy.org/site/community/minutes/minigroup/omero-features-meetings/2013-11-06-omero-features-google-hangout</a><br>

&gt;<br>
&gt; Summary:<br>
&gt; We&#39;re thinking of representing features as a 2D array, with metadata stored as key-value maps attached to the array, or individual columns or rows. These keys could describe things such as the feature name (column), sample metadata (row), algorithm parameters, calculation pipelines, etc.<br>

&gt;<br>
&gt; This should work as an OMERO API- in order to retrieve features you&#39;d pass in a set of key-value pairs, for instance to specify which features you want and which images/ROIs etc, and OMERO would handle the logic and return the feature table(s) matching those parameters. Since everyone has different requirements the keys could be anything, however we&#39;re trying to define a small set of standard keys- any suggestions are very welcome.<br>

&gt;<br>
&gt; Outside of OMERO we still need a format for transporting features, so we&#39;re thinking some form of HDF5.<br>
&gt;<br>
&gt; Simon<br>
&gt;<br>
&gt;<br>
&gt; The University of Dundee is a registered Scottish Charity, No: SC015096<br>
&gt; _______________________________________________<br>
&gt; ome-devel mailing list<br>
&gt; <a href="mailto:ome-devel@lists.openmicroscopy.org.uk">ome-devel@lists.openmicroscopy.org.uk</a><br>
&gt; <a href="http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel" target="_blank">http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel</a><br>
<br>
<br>
The University of Dundee is a registered Scottish Charity, No: SC015096<br>
_______________________________________________<br>
ome-devel mailing list<br>
<a href="mailto:ome-devel@lists.openmicroscopy.org.uk">ome-devel@lists.openmicroscopy.org.uk</a><br>
<a href="http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel" target="_blank">http://lists.openmicroscopy.org.uk/mailman/listinfo/ome-devel</a><br>
</blockquote></div><br></div></div>